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对 于 操作 系统 这 门 计算 机 专业 必修 课 ， 大 多 数 教材 采用 线性 教学 方法 ， 以 深度 为 导向 孤立 地 介绍 各 个 模 
块 ， 最 后 整合 起 来 理解 真正 的 操作 系统 。 而 本 书 采用 的 螺旋 方法 则 以 广度 为 导向 ， 首 先 给 出 一 些 基 本 概念 ， 
然后 描述 一 个 非常 简单 的 操作 系统 ， 之 后 逐步 将 其 演化 为 拥有 更 多 功能 的 复杂 系统 。 

相 比 之 下 ， 螺 旋 方 法 有 利于 学 生 在 课程 初期 自然 形成 对 操作 系统 各 模块 的 认识 与 理解 ， 同 时 不 断 积累 信 
心 来 处 理 更 为 复杂 的 问题 ， 循 序 渐进 ， 从 而 更 透彻 地 理解 操作 系统 的 本 质 。 


本 书 特色 


。 在 讨论 不 同 的 操作 系统 时 ， 会 还 原 到 其 所 在 的 历史 背景 中 ， 介 绍 当时 的 行业 状况 、 重 要 企业 和 个 人 ， 
便于 学 生 更 好 地 理解 操作 系统 的 发 展 和 演进 。 

® 洱 盖 各 类 便携 式 设备 上 的 现代 操作 系统 ， 而 不 限于 计算 机 操作 系统 。 

e 每 章 都 配 有 习题 ， 许 多 章节 还 配 有 实验 ， 帮 助 学 生 巩固 所 学 知识 ， 在 实践 中 强化 理解 。 
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文艺 复兴 以 来 ， 源 远 流 长 的 科学 精神 和 逐步 形成 的 学 术 规范 ;使 西方 国家 在 自然 科学 的 
各 个 领域 取得 了 垄断 性 的 优势 ; 也 正 是 这 样 的 优势 ， 使 美国 在 信息 技术 发 展 的 六 十 多 年 间 名 
家 辈出 、 独 领 风骚 。 在 商业 化 的 进程 中 ,美国 的 产业 界 与 教育 界 越 来 越 紧密 地 结合 ， 计 算 机 
学 科 中 的 许多 泰山 北斗 同时 身 处 科研 和 教学 的 最 前 线 ， 由 此 而 产生 的 经 典 科学 著作 ， 不 仅 璧 
划 了 研究 的 范畴 ， 还 揭示 了 学 术 的 源 变 ， 既 遵循 学 术 规范 ， 又 自 有 学 者 个 性 ， 其 价值 并 不 会 
因 年 月 的 流逝 而 减退 。 

近年 ， 在 全 球 信息 化 大 潮 的 推动 下 ,我国 的 计算 机 产业 发 展 迅猛 ， 对 专业 人 才 的 需求 日 
益 迫 切 。 这 对 计算 机 教育 界 和 出 版 界 都 既是 机 遇 ， 也 是 挑战 ; 而 专业 教材 的 建设 在 教育 战略 
上 显得 举足轻重 。 在 我 国信 息 技 术 发 展 时 间 较 短 的 现状 下 ， 美 国 等 发 达 国家 在 其 计算 机 科学 
发 展 的 几 十 年 间 积 淀 和 发 展 的 经 典 教材 仍 有 许多 值得 借鉴 之 处 。 因 此 ,引进 一 批 国外 优秀 计 
算 机 教材 将 对 我 国 计 算 机 教育 事业 的 发 展 起 到 积极 的 推动 作用 ， 也 是 与 世界 接轨 、 建 设 真正 
的 世界 一 流 大 学 的 必由之路 。 

机 械 工业 出 版 社 华章 公司 较 早 意识 到 “出 版 要 为 教育 服务 ”。 自 1998 年 开始 ， 我 们 
就 将 工作 重点 放 在 了 那 选 、 移 译 国外 优秀 教材 上 。 经 过 多 年 的 不 懈 努 力 ， 我 们 与 Pearson ， 
McGraw-Hill，Elsevier，MIT，John Wiley & Sons，Cengage 等 世界 著名 出 版 公司 建立 了 良 
好 的 合作 关系 ， 从 他 们 现 有 的 数 百 种 教材 中 甄选 出 Andrew S. Tanenbaum，Bjarne Stroustrup， 
Brian W. Kernighan, Dennis Ritchie, Jim Gray, Afred V. Aho, John E. Hopcroft，Jeffrey 
D. Ullman ，Abraham Silberschatz, William Stallings, Donald E. Knuth, John L. Hennessy, 
Larry L. Peterson 等 大 师 名 家 的 一 批 经 典 作品 ， 以 “计算 机 科学 丛书 ”为 总 称 出 版 ， 供 读者 
学 习 、 研 究 及 珍藏 。 大 理 石 纹理 的 封面 ， 也 正体 现 了 这 套 丛书 的 品位 和 格调 。 

“计算 机 科学 丛书 ”的 出 版 工作 得 到 了 国内 外 学 者 的 易 力 相助 ， 国 内 的 专家 不 仅 提供 了 
中 肯 的 选 题 指导 ， 还 不 辞 劳苦 地 担任 了 翻译 和 审 校 的 工作 ; 而 原 书 的 作者 也 相当 关注 其 作品 
在 中 国 的 传播 ， 有 的 还 专门 为 其 书 的 中 译本 作 序 。 迄 今 ,“ 计 算 机 科学 丛书 ”已 经 出 版 了 近 
两 百 个 品种 ， 这 些 书 籍 在 读者 中 树立 了 良好 的 口碑 ， 并 被 许多 高 校 采 用 为 正式 教材 和 参考 书 
籍 。 其 影印 版 “经 典 原版 书库 ”作为 姊妹 篇 也 被 越 来 越 多 实施 双语 教学 的 学 校 所 采用 。 

权威 的 作者 、 经 典 的 教材 、 一 流 的 译 者 、 严 格 的 审 校 、 精 细 的 编辑 ， 这 些 因 素 使 我 们 
的 图 书 有 了 质量 的 保证 。 随 着 计算 机 科学 与 技术 专业 学 科 建 设 的 不 断 完 善 和 教材 改革 的 逐渐 
深化 ,教育 界 对 国外 计算 机 教材 的 需求 和 应 用 都 将 步 人 一 个 新 的 阶段 ， 我 们 的 目标 是 尽 善 尽 
美 ， 而 反馈 的 意见 正 是 我 们 达到 这 一 终极 目标 的 重要 帮助 。 华 章 公司 欢迎 老师 和 读者 对 我 们 
的 工作 提出 建议 或 给 予 指正 ， 我 们 的 联系 方法 如 下 : 

华章 网 站 : www.hzbook.com 

电子 邮件 : hzjsj@hzbook.com 

联系 电话 : ( 010 ) 88379604 

联系 地 址 : 北京 市 西城 区 百 万 庄 南 街 1 号 

邮政 编码 : 100037 ， 华章 科技 图 书 出 版 中 心 





译 者 序 | 


Operating Systems: A Spiral Approach 


由 拉 米 兹 : 埃 尔 玛 斯 瑞 (Ramez Elmasri)、A. 吉尔 … 卡 里 克 (A. Gil Carrick)、 戴 维 . 莱 
文 (David Levine) 编写 的 这 本 书 是 一 本 以 学 生 为 中 心 的 具有 鲜明 特色 的 操作 系统 教材 ， 采 
用 螺旋 式 方法 由 浅 入 深 、 循序 渐进 地 阐述 操作 系统 的 相关 概念 和 设计 机 理 。 相 比 于 传统 教材 
所 采用 的 深度 导向 的 阐释 方法 ， 本 书 的 螺旋 式 方法 更 符合 人 们 的 学 习 规律 ， 也 更 有 利于 读者 
在 学 习 过 程 中 不 断 积聚 信心 ， 并 顺理成章 地 理解 和 掌握 越 来 越 复杂 的 操作 系统 概念 及 相关 方 
法 与 技术 ， 从 而 保证 学 习 效果 和 质量 。 与 此 同时 ， 作 者 写作 经 验 丰富 ， 任 教 阅历 和 操作 系统 
相关 领域 的 工作 经 验 丰富 ， 并 乐于 与 学 生 们 畅谈 操作 系统 当前 研究 状况 和 研习 操作 系统 最 新 
进展 ， 这 为 教材 的 高 质量 编写 创造 了 条 件 和 基础 。 我 们 翻译 这 本 教材 ， 目 的 是 期 望 对 国内 大 
学 的 操作 系统 课程 教学 方法 的 改革 和 实践 注入 新 鲜血 液 及 提供 适合 的 物质 基础 ， 改 善 学生 对 
操作 系统 设计 原理 的 理解 和 掌握 力度 ， 进 而 为 计算 机 操作 系统 这 一 核心 、 基 础 系统 软件 的 设 
计 和 开发 培养 高 质量 的 人 才 贡献 绵薄 之 力 。 

具体 而 言 ， 这 本 教材 具有 如 下 几 方 面 的 特色 和 优势 : = 

1 ) 注重 教材 编写 与 学 习 规 律 的 一 致 性 ， 在 介绍 操作 系统 概念 和 设计 机 理 的 过 程 中 ， 始 
终 贯彻 由 浅 入 深 、 由 易 到 难 的 编排 次 序 ， 从 而 使 复杂 概念 和 问题 的 理解 和 掌握 建立 在 相关 基 
础 性 概念 和 问题 均 已 理解 和 掌握 的 前 提 下 ， 于 是 所 谓 的 “复杂 ”已 不 再 那么 复杂 ， 学 习 者 自 
我 学 习 信 心 和 学 习 兴 趣 逐 渐 增 强 ， 学 习 效果 和 质量 得 到 了 保证 。 

2 ) 教材 编写 图 文 并 茂 ， 大 量 的 图 示 可 以 帮助 那些 更 擅长 形象 思维 的 学 习 者 更 好 地 理解 、 
掌握 相关 知识 点 和 内 容 ， 同 时 文字 编写 常常 采用 设 问 、 讨 论 等 会 话 式 写 作风 格 ， 从 而 避免 了 
过 度 学 究 式 说 教 风格 让 学 生产 生 厌 学 情绪 和 影响 课程 学 习 效果 ， 而 且 通 过 多 种 学 习 模 式 的 支 
持 还 可 保证 学 习 质 量 和 提高 学 习 效果 。 

3 ) 把 相关 操作 系统 重新 还 原 到 当时 具有 实际 时 代 意 义 的 历史 环境 中 ， 有 助 于 学 生 更 好 
地 理解 操作 系统 的 相关 知识 。 因 此 ， 对 于 单独 分 析 讨 论 的 各 种 操作 系统 ， 无 论 在 螺旋 式 教学 
章节 还 是 在 实例 研究 部 分 ， 教 材 也 会 介绍 当时 工业 发 展 的 一 些 史实 ， 有 时 甚至 会 提 到 主要 的 
公司 或 个 大 ， 这 对 于 学 生 全 面 理解 操作 系统 概念 和 技术 的 起 源 及 需求 ， 甚 至 对 于 学 生 创新 思 
维 的 培养 将 具有 非常 重要 的 推动 作用 。 

4 ) 教材 资源 丰富 ， 为 教学 的 顺利 开展 英 定 了 坚实 的 基础 。 每 一 章 结尾 部 分 均 配 有 习题 ， 
可 以 帮助 读者 有 针对 性 地 加 强 对 相应 知识 的 理解 和 掌握 。 全 书 最 后 附 有 索引 ， 可 方便 读者 快 
速 查阅 相关 概念 和 关键 术语 。 服 务 于 本 教材 的 配套 网 站 提供 了 课件 ， 方 便 学 生 预 习 使 用 ， 也 
方便 教师 开展 课堂 教学 时 在 此 基础 上 加 以 裁剪 和 修正 使 用 ， 同 时 提供 给 教师 的 习题 答案 还 可 
方便 教师 批阅 作业 时 参考 。 另 外 ， 配 套 网 站 为 许多 章节 还 配备 有 实验 课题 ， 可 方便 教师 布置 
实验 设计 作业 并 使 学 生 在 实践 中 强化 理解 。 

本 书 适合 作为 学 时 安排 为 一 个 学 期 昌 为 大 学 二 年 级 以 上 的 学 生 开设 的 操作 系统 本 科 课 程 
的 教材 。 

本 书 的 出 版 得 到 了 机 械 工业 出 版 社 华 章 公 司 和 北京 交通 大 学 的 大 力 支持 ， 在 此 表示 最 真 
诚 的 感谢 ! 特别 要 感谢 曲 烟 老师 为 本 书 的 出 版 所 做 的 辛苦 工作 和 努力 ! 同时 非常 感谢 朱 秀 英 


编辑 对 译 稿 文字 的 精心 校对 和 中 肯 建 议 ! 特别 感谢 唐 晓 琳 编辑 对 译 稿 排 版 组 织 的 精美 设计 和 
对 译文 质量 的 精 雕 细 琢 ! 

翟 高 寿 对 全 书 所 有 内 容 进行 了 翻译 、 审 阅 和 校正 。 以 下 人 员 提 供 了 部 分 章节 的 译文 草 
稿 : 刘 晨 (第 15 章 和 第 19 章 )， 任 艳 艳 (第 17 章 和 第 18 章 )， 孙 浩 林 (第 16 章 和 第 20 章 )， 
贾 靖 仪 (第 8 章 和 附录 )， 朱 雪 燕 (第 6 章 和 第 11 章 )， 翟 瑞 霞 (第 7 章 、 第 10 章 和 第 13 
章 ), 王 佳 (第 5 章 和 第 9 章 )， 韩 梦 梦 (第 12 章 和 第 14 章 )。 在 此 对 他 们 的 贡献 表示 诚挚 的 
感谢 。 

尽管 译 者 已 经 反复 阅读 和 审 校 译文 ， 并 竭尽 全 力 地 以 “ 信 、 达 、 雅 ”为 标准 来 再 现 原作 
者 的 论述 本 意 和 写作 水 平 ， 但 鉴于 译 者 水 平 有 限 ， 难 免 仍 有 下 漏 或 不 当 之 处 ， 欢 迎 各 位 专家 
和 广大 读者 批评 指正 。 


椎 高 寿 
2017 年 10 月 于 北京 交通 大 学 
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Operating Systems: A Spiral Approach 


著 书 起 因 


长 期 以 来 ,我 们 深刻 领会 到 传统 的 操作 系统 课程 教学 方法 并 非 最 好 的 方法 。 本 书 将 采用 
非 传统 教学 方法 来 支持 达成 相关 教学 任务 。 当 学 习 任 何 一 门 学 问 时 ， 关 于 原理 、 规 则 、 思 想 
和 概念 的 层级 体系 的 学 习 次 序 ， 可 能 会 让 学 习 过 程 变 得 更 加 容易 或 者 更 为 困难 。 最 通用 的 做 
法 是 把 课程 划分 为 若干 个 主题 ， 然 后 逐个 具体 展开 和 分 别 进行 学 习 。 就 操作 系统 而 言 ， 传 统 
做 法 就 是 首先 概括 介绍 操作 系统 和 简要 解释 一 些 术语 ， 然 后 让 学 生 就 进程 和 进程 管理 、 存 储 
管理 、 文 件 系统 等 孤立 主题 分 别 进一步 深入 学 习 。 我 们 称 之 为 深度 导向 的 教学 方法 或 纵向 型 
教学 方法 。 学 生 在 学 习 这 些 孤 立 主题 领域 大 量 不 相关 细节 知识 的 基础 上 ， 针 对 具体 实例 和 实 
际 操 作 系 统 例子 进行 分 析 研 究 ， 最 终 实现 不 同 主题 的 融会 贯通 ， 搞 清楚 如 何 把 不 同 的 功能 模 
块 整合 到 一 起 来 形成 一 个 实用 的 操作 系统 。 

我 们 认为 ， 儿 童 学 习 一 门 语言 时 可 遵循 的 较 好 模型 应 当 是 : 首先 学 习 一 些 单词 、 一 些 语 
法 、 一 些 句 型 ， 然 后 (螺旋 式 ) 重复 这 一 过 程 ， 即 不 断 学 习 更 多 的 单词 、 更 多 的 语法 、 更 多 
的 句 型 。 通 过 螺旋 式 重复 相同 的 学 习 过 程 ， 最 终 精 通 语言 和 征服 语言 的 复杂 性 。 我 们 称 之 为 
广度 导向 的 教学 方法 或 螺旋 式 教学 方法 。 

本 教材 把 螺旋 式 教学 方法 运用 到 操作 系统 课程 教学 中 。 前 面 几 章 给 出 一 些 基本 的 背景 知 
识 和 概念 定义 。 在 此 基础 上 ， 开 始 描 述 面向 一 个 简单 系统 (早期 的 个 人 计算 机 ) 的 非常 简单 
的 操作 系统 ， 然 后 逐渐 向 拥有 更 多 功能 的 复杂 系统 演化 : 从 有 限 的 后 台 任 务 ( 辟 如 并 发 打印 ) 
到 多 任务 ， 等 等 。 对 于 任何 一 个 阶段 和 相应 的 系统 ， 我 们 始终 坚持 建立 逐渐 增加 的 需求 与 系 
统 设计 之 间 的 关联 关系 ,并 阐明 二 者 间 的 关联 效应 。 当 然 ， 此 间 论 述 并 不 一 定 完全 对 应 操作 
系统 发 展 的 确切 的 历史 次 序 。 特 别 是 ， 为 了 能 够 讲 清楚 不 同 的 操作 系统 模块 之 间 如 何 相互 
衔接 和 彼此 影响 ， 我 们 在 每 个 复杂 层级 上 还 选择 了 一 个 代表 性 的 系统 展开 详细 说 明 。 我 们 确 
信 ， 这 种 方法 将 有 利于 学 生 更 好 地 理解 和 掌握 操作 系统 每 一 层级 的 诸多 功能 是 如 何 被 整合 到 
一 起 的 。 

之 所 以 采用 这 种 方法 ， 在 一 定 程度 上 也 和 所 有 计算 科学 专业 学 生 均 无 一 例外 地 要 求 必修 
操作 系统 课程 存在 一 定 关系 。 诚 然 ， 这 些 学 生 中 的 大 部 分 将 来 从 事 操作 系统 开发 工作 的 可 能 
性 微乎其微 ， 然 而 ， 除 极 个 别 学 生 的 工作 可 能 与 没有 操作 系统 的 做 和 人 式 系统 打交道 外 ， 大 多 
数学 生 所 从 事 的 工作 依赖 的 系统 将 运行 在 操作 系统 平台 之 上 。 对 于 他 们 而 言 ， 操 作 系统 位 于 
应 用 程序 和 硬件 之 间 ， 若 不 能 清晰 理解 操作 系统 基本 知识 ， 将 意味 着 相关 应 用 程序 最 好 不 过 
是 低 效 运行 ， 最 坏 情况 下 甚至 危险 运行 。 我 们 相信 ， 相 对 于 传统 方法 来 讲 ， 我 们 的 方法 将 有 
助 于 引导 学 生 更 好 地 理解 和 掌握 现代 操作 系统 的 整体 结构 。 


内 容 组 织 


在 本 书 的 第 一 部 分 ， 我们 给 出 了 一 些 通常 的 背景 知识 。 它 们 涵盖 操作 系统 的 基本 原理 ， 
并 从 不 同 角度 诠释 了 操作 系统 。 同 时 ， 还 概括 说 明了 操作 系统 所 控制 的 典型 计算 机 硬件 。 另 
外 一 章 则 阐述 了 进程 、 多 道 程序 设计 、 分 时 、 资 源 管理 等 概念 及 不 同 的 操作 系统 体系 结构 和 
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构建 方法 。 

在 本 书 的 第 二 部 分 ,我 们 采用 螺旋 式 方法 ,按照 复杂 性 逐渐 递增 的 次 序 ， 依 次 介绍 和 说 
明了 如 下 5 种 类 型 的 操作 系统 : 

1 ) 简单 的 单 进程 操作 系统 (CP/M)。 

2 ) 允许 简单 系统 多 任务 化 的 较为 复杂 的 操作 系统 (Palm 操作 系统 )。 

3 ) 针对 单 用 户 的 完全 多 任务 化 的 操作 系统 (苹果 电脑 Mac 操作 系统 ，OS X 前 身 )。 

4 ) 多 用 户 操作 系统 (Linux)。 

5 ) 分 布 式 操作 系统 (主要 是 Globus 集群 )。 

针对 每 一 种 操作 系统 ， 我 们 分 别 选择 典型 的 操作 系统 展开 讨论 ， 使 相关 知识 更 加 有 具体 
明了 。 典 型 操作 系统 的 选择 兼顾 了 实用 性 。 我 们 首先 从 进程 、 内 存 、 文 件 和 输入 /输出 管理 
等 方面 讨论 了 简单 的 系统 ， 然 后 通过 逐渐 引入 多 任务 、 分 时 、 网 络 连接 、 安 全 和 其 他 问题 来 
(循序 渐进 地 ) 讨论 更 为 复杂 的 系统 。 有 时 候 我 们 也 会 提 到 其 他 一 些 众 所 周知 的 操作 系统 作 
为 特定 类 型 的 例子 ， 璧 如 第 3 章 的 微软 DOS 操作 系统 (MS-DOS) 和 第 4 章 的 Symbian 操 
作 系 统 。 

在 本 书 的 第 三 一 五 部 分 ， 我 们 转向 深度 导向 的 教学 方法 ， 针 对 各 种 操作 系统 主题 (从 进 
程 到 内 存 管 理 ， 再 到 文件 系统 ) 展开 详细 说 明 。 我 们 还 讨论 了 许多 在 操作 系统 领域 最 近 才 出 
现 的 热点 问题 ， 如 线程 化 、 面 向 对 象 、 安 全 以 及 并 行 和 分 布 式 系统 的 相关 方法 。 在 相应 章节 
中 ， 我 们 将 重 温 第 二 部 分 曾 讨论 过 的 实例 系统 ， 并 进一步 详细 解释 (尤其 是 现代 操作 系统 的 ) 
相关 机 制 。 

: 在 第 六 部 分 ， 我 们 将 以 所 谓 实例 研究 的 方式 ， 就 一 些 操作 系统 进一步 展开 深入 探讨 。 鉴 
于 我 们 已 经 在 前 面 章节 介绍 了 许多 细节 内 容 ， 所 以 在 此 我 们 将 立足 于 从 更 深层 次 审视 相关 系 
统 ， 从 而 探析 某 些 功 能 的 内 部 实现 机 制 。 其 中 的 两 个 实例 研究 将 围绕 第 二 部 分 涵盖 的 操作 系 
统 进行 分 析 讨 论 。 

附录 部 分 罗列 了 基本 的 计算 机 硬件 体系 结构 ， 以 方便 那些 不 要 求 把 此 类 课程 作为 操作 系 
统 课程 先 修 课程 的 教育 机 构 在 选用 本 教材 时 使 用 。 它 们 也 可 为 那些 需要 复习 特定 主题 的 学 习 
者 提供 参考 。 


写作 风格 


e 我 们 倡导 会 话 式 写作 风格 ， 以 避免 过 度 的 学 究 式 说 教 风格 让 学 生产 生 厌 学 情绪 和 影 
响 课 程 学 习 效 果 。 

我 们 避免 使 用 过 多 的 形式 化 描述 ， 较 为 规范 的 描述 仅 用 于 必需 的 特定 场合 。 这 样 做 
的 理由 在 于 ， 大 多 数学 生 将 来 并 不 会 从 事 开 发 操作 系统 的 工作 ， 而 往往 是 基于 操作 
系统 来 支持 应 用 程序 的 开发 、 运 营 或 维护 。 

。 一 般 情况 下 ,我 们 使 用 规范 的 、 公 认 的 术语 。 但 是 ， 当 不 存在 公认 的 标准 术语 或 着 
眼 于 说 明 特 定 历史 时 期 采用 的 其 他 术语 时 ,我 们 也 会 讨论 其 他 说 辞 或 用 语 。 

通常 ， 我 们 讨论 算法 解决 方案 而 不 列 出 实际 代码 ， 因 为 不 同学 校 的 学 生 往往 接触 和 
掌握 的 是 不 同 的 编程 语言 。 

我 们 认为 ， 如 果 把 相关 操作 系统 重新 还 原 到 当时 具有 实际 时 代 意 义 的 历史 背景 环境 
中 ， 将 有 助 于 学 生 更 好 地 理解 操作 系统 的 相关 知识 。 因 此 ， 对 于 单独 分 析 讨论 的 各 
操作 系统 ， 无 论 在 螺旋 式 教 学 章节 还 是 在 实例 研究 部 分 ， 我 们 也 会 介绍 当时 工业 发 
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展 的 一 些 史实 ， 有 时 甚至 会 提 到 主要 的 公司 或 个 人 。 

e 考虑 到 学 生 天 天 都 在 使 用 按照 惯例 并 不 被 视 作 计算 机 的 各 种 装置 ， 而 且 对 它们 的 操 
作 非 常熟 悉 ， 所 以 本 教材 内 容 涵 盖 这 些 便携 式 装置 上 的 现代 操作 系统 。 

。 我 们 在 教材 中 使 用 了 大 量 的 图 示 ， 以 帮助 那些 不 喜欢 嘲 读 词句 而 更 擅长 形象 思维 的 
学 习 者 更 好 地 理解 和 掌握 相关 知识 点 和 内 容 。 

。 各 章 结束 部 分 分 别 配 备 一 套 习题 ， 方 便 学 习 者 用 于 评估 自己 关于 对 应 章节 内 容 的 理 
解 和 掌握 情况 。 

e 许多 章节 还 配备 有 实验 课题 ， 可 方便 教师 布置 实验 设计 作业 并 使 学 生 在 实践 中 强化 
理解 。 


| 教材 使 用 说 明 


Operating Systems: A Spiral Approach 


如 何 使 用 本 教材 : 对 教师 的 建议 


这 本 教科 书 可 用 于 学 时 安排 为 一 个 学 期 上 且 为 大 学 三 年 级 或 者 四 年 级 的 学 生 开 设 的 操作 系 
统 本 科 课 程 。 本 书 的 第 一 部 分 着 眼 于 为 后 续 各 章节 葛 定 必需 的 基本 背景 知识 。 第 1 章 主要 采 
用 设 问 和 讨论 的 叙述 方式 ， 并 提供 基于 历史 视角 的 若干 观点 。 任 课 教师 可 以 略 读 这 一 章 并 决 
定 包含 哪些 教学 内 容 。 附 录 部 分 则 是 对 比较 现代 的 硬件 体系 结构 的 简要 介绍 。 如 果 硬 件 课程 
没有 作为 本 课程 的 先 修 课程 ， 那 么 建议 把 附录 内 容 包 含 在 教学 过 程 中 。 第 2 章 定 义 了 操作 系 
统 用 到 的 一 些 简单 术语 ， 并 提供 了 关于 操作 系统 设计 这 一 更 大 主题 的 更 多 观点 。 同 样 ， 任 课 
教师 可 以 对 这 一 章 的 内 容 进 行 复 习 ， 并 选择 在 教学 中 包含 或 者 排除 某 部 分 内 容 。 

第 二 部 分 采用 了 螺旋 式 方法 。 我 们 认为 ， 这 是 本 书 最 具 特 色 的 部 分 。 在 这 一 部 分 ， 学 生 
可 以 渐进 式 地 领略 到 一 系列 设计 目标 越 来 越 复杂 的 操作 系统 。 其 中 只 有 两 章 内 容 在 操作 系统 
教科 书 中 属于 不 同 寻常 的 主题 ， 即 关于 单 用 户 多 任务 操作 系统 的 第 4 章 和 关于 分 布 式 系统 的 
第 7 章 。 这 两 章 可 由 教师 自行 决定 是 否 跳 过 ， 不 过 必须 指出 ， 越 来 越 多 的 学 生 将 会 以 用 户 身 
份 或 者 程序 员 角 色 工 作 在 那样 的 系统 环境 中 。 

三 一 六 部 分 则 着 眼 于 对 操作 系统 的 深度 剖析 。 在 这 些 部 分 ， 除 了 第 12 章 和 第 13 章 彼 

此 之 间 密 切 相 关 以 外 ， 其 余 各 章 均 相对 独立 。 另 外 ， 对 于 从 第 14 章 开始 的 各 章 来 说 ， 如 果 
对 应 标题 是 要 求学 生 选 修 的 另 一 课程 的 主题 ， 那 么 相应 章节 可 以 跳 过 。 

请 注意 有 关 的 参考 文献 : 各 章 所 引用 的 文献 往往 被 广泛 认为 是 比较 重要 的 资料 或 者 是 很 
好 的 总 结 ， 而 且 有 可 能 涵盖 本 教材 所 没有 提 到 的 内 容 。 如 果 教 师 或 学 生 想 要 查阅 材料 以 便 能 
够 更 好 地 理解 特定 主题 ， 那 么 建议 研读 相应 的 文献 。 


如 何 使 用 本 教材 : 对 学 生 的 建议 


对 于 学 生来 说 ， 使 用 这 本 教科 书 最 重要 的 事情 就 是 要 搞 清 楚 如 何 才能 学 得 最 好 。 让 大 脑 
牢记 信息 的 途径 可 以 有 好 多 种 。 本 教科 书 自身 就 直接 提供 了 两 种 这 样 的 途径 。 显 而 易 见 ， 本 
书 图 文 并 茂 ， 既 适用 于 那些 擅长 咬文嚼字 式 读 书 的 人 ， 又 适用 于 那些 倾向 于 视觉 型 学 习 风 格 
的 人 。 当 参加 课堂 听讲 时 ， 你 将 聆听 到 教师 对 教材 内 容 的 讲解 ， 这 适用 于 那些 擅长 通过 听讲 
来 获取 知识 的 人 。 与 此 同时 ， 任 课 教师 也 可 以 使 用 配合 本 教科 书 提供 的 课件 等 直观 教具 。 同 
样 ， 这 对 于 那些 擅长 通过 读书 和 看 图 来 学 习 知 识 的 人 来 说 也 是 非常 有 益 的 。 有 些 学 生 擅 长 机 
械 地 学 习 ， 故 而 对 于 那些 学 生来 说 ， 概 括 教材 内 容 或 者 做 好 学 习 笔 记 往往 可 以 获得 不 错 的 学 
习 效 果 。 

与 其 他 教材 相同 ， 本 书 在 各 章 的 结尾 部 分 同样 也 提供 了 针对 相关 内 容 的 习题 。 这 些 习题 
是 这 样 设计 的 : 对 于 那些 已 经 掌握 了 有 关 教学 内 容 的 学 生来 说 应 当 能 够 正确 回答 相应 的 问题 。 

在 新 的 知识 进入 大 脑 的 过 程 中 ， 往 往 需 要 花费 一 定 的 时 间 才 能 够 和 原 有 的 其 他 信息 有 
机 地 关联 起 来 。 然 而 ， 如 果 一 天 内 大 脑 接受 了 很 多 信息 ， 那 么 那些 不 太 重要 的 信息 大 脑 常 常 
不 会 保留 ， 只 有 在 相同 或 相似 信息 间隔 不 长 时 间 就 再 次 呈献 给 大 脑 时 ， 大 脑 才 会 记 住 相应 信 
息 。 采 用 的 不 同 机 制 越 多 、 有 关 信 息 的 重复 次 数 越 多 ， 对 应 教学 内 容 的 保持 才 会 越 持 久 和 


越 牢固 。 因 此 ， 最 好 的 学 习 方法 就 是 综合 运用 各 种 方法 ， 并 重点 采用 适合 你 和 你 所 擅长 的 
方法 。 我 们 发 现 ， 对 于 大 多 数学 生来 说 ， 采 用 如 下 的 学 习 方 式 或 次 序 往往 会 取得 很 好 的 学 习 
效果 : 

。 提前 打印 涵盖 下 一 节 教 学 内 容 的 课件 (每 页 若干 张 幻灯 片 )。 

e 阅读 教科 书 中 的 指定 内 容 ， 并 特别 注意 所 打印 课件 中 给 定 的 问题 。 

e 进入 课堂 聆听 教师 讲解 ,认真 做 笔记 ,特别 是 教师 提 到 的 不 在 教科 书 上 的 内 容 。( 相 
关 知 识 点 往往 是 教师 喜欢 的 问题 ， 而 且 常 常会 出 现在 考题 中 。) 

e 对 于 任何 不 清楚 的 地 方 要 及 时 提问 和 请 教 。 

e 在 准备 考试 和 复习 教学 内 容 的 时 候 ， 重 新 过 一 遍 课 件 。 如 果 还 有 某 些 知识 点 不 太 清 
楚 ， 要 找到 教科 书 上 对 应 章节 彻底 搞 清 楚 和 确保 真正 掌握 。 如 果 还 有 疑问 ， 那 么 请 
联系 教师 和 助教 加 以 解决 。 

e 在 学 生 认为 方便 的 任何 时 候 对 相关 习题 进行 研究 。 


为 教师 提供 的 资源 9 


本 教科 书 通过 一 个 网 站 为 教师 和 学 生 分 别提 供 了 彼此 分 离 和 独立 的 支持 : 
se 只 要 发 现 有 需要 ， 就 会 不 时 地 为 本 教科 书 提供 补充 材料 。 
e 为 教师 提供 了 一 组 建议 性 的 实验 项 目 课题 ， 其 中 大 多 数 的 实验 项 目 作 者 将 会 在 教学 
过 程 中 加 以 使 用 。 这 些 项 目 足 够 丰富 且 与 特定 操作 系统 平台 是 无 关 的 ， 故 而 能 够 方 
便 地 加 以 调整 和 适用 于 任何 教学 场景 。 它 们 不 依赖 于 任何 特定 的 软件 包 ， 因 此 不 要 
求教 师 、 学 生 或 助教 开展 相关 实验 前 加 以 掌握 。 
正如 前 面 所 提 到 的 ， 为 学 生 提 供 了 可 用 的 课件 。 对 于 教师 而 言 ， 则 鼓励 对 这 些 课件 
.进行 修改 以 满足 特定 的 需求 ， 同 时 要 求 给 出 相应 课件 的 出 处 并 给 以 致谢 。 
为 教师 提供 了 习题 答案 ， 以 便于 他 们 不 会 因为 不 太 清 楚 某 些 星 涩 难 懂 的 但 作者 认为 
重要 的 知识 点 而 不 好 意思 或 陷 人 尴 众 境地 。 
在 有 关 网 站 上 维护 一 个 当前 最 新 的 勘误 表 。 

e 许多 章节 提供 了 所 参考 的 网 上 资源 ， 但 考虑 到 相关 网 站 极 易 发 生 改 变 ， 所 以 本 教科 

书 的 支持 网 站 将 会 保持 一 份 最 新 版 的 网 上 资源 信息 。 

致谢 

事实 上 ， 本 教科 书 已 经 构思 相当 长 的 时 间 了 ， 比 我 们 可 以 记 起 的 时 间 还 要 长 。 麦 格 
劳 - 希 尔 (McGraw-Hill) 出 版 社 对 我 们 给 予 了 格外 的 耐心 。 特 别 是 ， 我 们 愿意 把 最 诚挚 
的 谢意 献 给 麦 格 劳 = 希 尔 出 版 社 的 如 下 同仁 : 梅林 达 ' 毕 莱 基 (Melinda Bilecki)、 凯 “ 布 
莱 迈 耶 (Kay Brimeyer)、 布 伦 达 ' 罗 尔 维 斯 (Brenda Rolwes)、 卡 拉 ， 库 卓 恩 维 芯 ( Kara 
Kudronowicz)、 费 伊 ， 仙 凌 (Faye Schilling) 以 及 拉 古 * 斯 里 尼 瓦 又 ( Raghu Srinivasan ) 。 
同时 ， 我们 也 要 感谢 曾 在 我 们 启动 本 书写 作 时 担任 编辑 的 艾 伦 * 阿 普 特 ( Alan Apt) 和 艾 米 


丽 . 陆 帕 什 (Emily Lupash)。 最 后 ,我 们 还 要 感谢 埃 里 卡 * 乔丹 (Erika Jordan) 和 劳 拉 ' 潘 
池 考 夫 斯 基 (Laura Patchkofsky) 对 松树 构图 的 创意 。 


日 关于 本 书 教 辅 资源 ， 用 书 教师 可 向 麦 格 劳 - 希 尔 教育 出 版 公司 北京 代表 处 申请 ， 电 话 : 8008101936/010- 
62790299-108， 电 子 邮件 : instructorchina@mcgraw-hill.com。 一 一 编辑 注 
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第 18 章 关 于 “Windows Vista” 的 内 容 由 微软 公司 的 戴 夫 : 普罗 伯 特 (Dave Probert) 进 
行 了 审阅 。 针 对 我 们 只 能 进行 推测 的 一 些 事项 以 及 由 此 引起 我 们 关注 的 若干 问题 ， 他 为 我 们 
提供 了 非常 有 价值 的 反馈 建议 和 意见 。 他 的 参与 是 由 阿尔 卡 季 ' 瑞 蒂 克 ( Arkady Retik) 与 
微软 公司 协同 安排 的 。 另 有 两 章 是 由 我 们 在 得 克 萨 斯 大 学 阿 灵 顿 分 校 的 同事 审阅 的 。 有 具体 而 
言 ， 刘 永和 (Yonghe Liu) 审阅 了 第 15 章 ， 而 马 修 * 赖 特 ( Matthew Wright) 则 审阅 了 第 16 . 
章 。 另 一 位 教师 巴赫 拉 姆 . 哈 利 利 (Bahram Khalili) 在 他 的 操作 系统 课 上 使 用 了 本 教科 书 的 
草稿 。 当 然 ， 若 有 任何 遗留 问题 ， 责 任 在 于 我 们 ， 而 与 他 们 没有 关系 。 

还 有 ， 我 们 已 经 利用 这 些 素材 的 草稿 好 多 年 了 。 在 此 ， 我 们 希望 表达 对 我 们 的 所 有 学 
生 以 及 他 们 所 反馈 的 意见 和 建议 的 感谢 。 特 别 是 ， 我们 要 感谢 如 下 学 生 : 扎 希 尔 * 纳 莱恩 
( Zaher Naarane)、 菲 尔 . 伦 纳 ( Phil Renner)、 威 廉 * 皮 科 克 ( William Peacock)、 韦 斯 * 由 
里 什 (Wes Parish)、 凯 尔 D. 威 特 (Kyle D. Witt)、 戴 维 M. 康 奈 利 (David M. Connelly) 以 及 
斯 科 特 * 珀 迪 (Scott Purdy ) 。 


关于 遗留 错误 的 声明 


多 名 作者 协作 完成 一 项 计划 的 困难 之 一 在 于 ， 某 位 作者 本 来 是 好 心 ， 然 而 却 可 能 修改 了 
并 非 他 自己 所 写 的 一 些 文字 ， 尽 管 他 自己 认为 是 在 澄清 一 些小 的 问题 ， 但 是 却 以 某 种 不 易 察 
觉 而 非常 重要 的 方式 修改 了 相应 的 含义 。 因 此 ， 你 可 能 会 发 觉 教材 中 还 存留 某 些 小 问题 。 当 
然 ， 这 些 错 误 并 非 是 原先 作者 的 错误 。 毋 庸 置疑 ， 原 先 的 作者 准确 无 误 地 完成 了 最 初 的 文 
稿 ， 相 关 错 误 可 能 是 另 一 满怀 善意 但 却 对 相关 材料 不 很 熟悉 的 作者 引入 的 。 

无 论 如 何 ， 总 可 能 会 存在 这 样 一 些 错误 ， 所 以 我 们 必须 要 认真 地 加 以 处 理 。 因 此 ， 如 果 
你 发 现 了 错误 ， 我 们 非常 高 兴 和 希望 知道 它们 是 什么 错误 。 我 们 将 会 发 布 勘误 表 ， 在 下 一 版 
中 予以 修正 ,确定 责任 人 员 ， 并 适当 处 理 出 错 的 作者 。 


作者 介绍 | 


Operating Systems: A Spiral Approach 


我 们 使 用 其 他 教材 讲授 操作 系统 课程 已 经 好 多 年 了 。 由 于 希望 采用 另 一 种 不 同 的 教学 
方法 ,我 们 编写 了 这 本 教材 。 我 们 全 都 是 得 克 萨 斯 大 学 阿 灵 顿 分 校 ( University of Texas at 
Arlington，UTA) 计算 机 科学 与 工程 系 的 教师 。 

拉 米 兹 ' 埃 尔 到 斯 瑞 ( Ramez Elmasri) 得 克 萨 斯 大 学 阿 灵 顿 分 校 教授 。1972 年 在 埃 
及 亚历山大 大 学 电气 工程 专业 获 学 士 学 位 ，1980 年 在 斯 坦 福 大 学 计算 机 科学 专业 获 硕士 学 
位 和 博士 学 位 。 他 当前 的 研究 兴趣 包括 传感器 网 络 、 射 频 识别 、 生 物 信息 学 数据 介质 、 查 询 
个 性 化 以 及 系统 集成 。 他 是 教材 《 Fundamentals of Database Systems 》( 数 据 库 系统 基础 ) 的 
第 一 作者 ， 该 教材 已 发 行 至 第 5 版 。 他 以 往 的 研究 涵盖 数据 库 、 概 念 建 模 和 分 布 式 系统 的 各 
个 方面 。 

A. 吉尔 . 卡 里 克 ( A. Gil Carrick) 以 前 是 得 克 萨 斯 大 学 阿 灵 顿 分 校 讲 师 ， 现 已 从 教师 
岗位 退休 。1970 年 在 休斯敦 大 学 电子 技术 专业 获 学 士 学 位 ，2000 年 在 得 克 萨 斯 大 学 阿 灵 顿 
分 校 计算 机 科学 专业 获 硕 士 学 位 。 他 是 计算 机 科学 荣誉 学 会 的 成 员 。 他 的 职业 跨越 整个 信息 
技术 产业 ， 包 括 终 端 用 户 组 织 、 硬 件 制造 商 、 软 件 出 版 商 、- 第 三 方 维护 机 构 、 大 学 以 及 研发 
公司 。 他 为 专业 期 刊 扎 稿 ， 并 编辑 信息 技术 书籍 ， 相 关 选 题 主要 集中 在 网 络 领域 。 在 他 的 职 
业 生 涯 中 ， 这 本 教材 中 所 讨论 的 所 有 操作 系统 他 都 使 用 过 ， 他 甚至 还 使 用 过 许多 其 他 的 操作 
系统 。 

戴 维 . 莱 文 ( David Levine) 讲授 操作 系统 、 软 件 工程 、 网 络 和 计算 机 体系 结构 课程 。 
他 的 研究 兴趣 包括 移动 计算 、 移 动 对 象 和 分 布 式 计算 ， 整 理 的 相关 研究 成 果 发 表 在 近 几 年 的 
出 版 物 和 若干 国际 会 议 上 。 他 喜欢 讨论 操作 系统 ， 与 学 生 畅谈 操作 系统 的 当前 研究 ， 并 研习 
操作 系统 的 最 新 进展 。 
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Operating Systems: A Spiral Approach 


操作 系统 概述 





本 书 第 一 部 分 共 包 含 两 章 : 

第 1 章 主要 给 出 了 关于 “操作 系统 (OS) 是 什么 ?” 的 基本 解释 ， 冰 明了 操 
作 系 统 为 普通 用 户 和 编程 人 员 提 供 的 各 种 服务 。 也 正 是 由 于 有 了 相应 服务 ， 才 使 
得 计算 机 的 使 用 不 再 要 求 用 户 必须 掌握 那些 低级 繁琐 的 机 器 “秘笈 "， 而 可 以 专 
注 于 要 解决 的 问题 。 这 些 问 题 可 以 是 任何 事情 ， 不 仅 包 括 我 们 通常 想到 的 计算 活 
动 ， 而 且 还 包括 诸如 玩 游戏 、 动 态 生成 艺术 作品 和 监控 汽车 发 动机 性 能 等 。 

第 2 章 则 就 操作 系统 概念 、 相 关 模 块 及 体系 结构 提供 了 一 个 初步 的 高 层次 的 
概貌 ， 同 时 还 就 学 生 需 要 了 解 的 一 般 术语 进行 了 介绍 ， 从 而 为 他 们 学 习 第 二 部 分 
所 呈现 的 各 种 越 来 越 复杂 的 操作 系统 打下 基础 。 
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操作 系统 ( Operating System，OS) 是 每 台 计算 机 的 核心 所 在 。 操 作 系 统 为 普通 用 户 和 
编程 人 员 提 供 服务 ， 从 而 使 计算 机 的 使 用 无 须 处 理 那些 低级 的 、 难 以 掌控 的 硬件 指令 。 它 
为 计算 机 操作 极为 广泛 的 各 类 设备 一 一 从 输入 /输出 设备 (例如 打印 机 和 数码 相机 ) 到 支 
持 计 算 机 之 间 进 行 通信 的 有 线 或 无 线 网 络 部 件 一 一 提供 相对 统一 的 访问 接口 。 它 支持 用 户 
创建 、 管 理 和 组 织 各 种 类 型 的 文件 。 此 外 ， 大 多 数 现代 操作 系统 还 提供 了 图 形 化 用 户 接口 
(Graphical User Interface，GUI)， 从 而 使 用 户 可 以 更 加 方便 简单 地 操作 计算 机 。 

作为 开篇 第 一 章 ， 我 们 将 在 第 1.1 节 中 简要 说 明 操作 系统 的 重要 性 和 普遍 性 (关于 后 者 ， 
是 指 其 不 仅 广泛 使 用 在 计算 机 中 ， 而 且 还 大 量 存在 于 我 们 日 常生 活 使 用 的 各 类 电子 设备 中 )。 
在 第 1.2 节 ， 则 从 相对 技术 的 角度 出 发 ， 盖 明了 即便 简单 设备 也 包含 操作 系统 的 理由 。 接 下 
来 在 第 1.3 节 ， 我 们 从 观察 操作 系统 的 两 个 角度 〈 即 用 户 视图 和 系统 视图 ) 出 发 ， 围 绕 “ 操 
作 系 统 做 什么 ?” 的 问题 ,讨论 了 各 种 不 同 的 观点 。 同 时 ,我 们 也 讨论 了 各 种 类 型 的 用 户 对 
操作 系统 的 具体 需求 。 在 此 基础 上 ， 还 通过 一 些 简单 的 例子 ， 具 体 说 明 操作 系统 是 如 何 一 步 
步 执行 对 应 功能 ， 从 而 接受 和 完成 看 起 来 非常 简单 的 用 户 请 求 的 。 在 第 1.4 节 ， 我 们 提出 了 
一 些 基本 的 术语 和 概念 ， 并 通过 一 些 图 示 说 明了 组 成 一 个 简单 操作 系统 的 典型 模块 。 最 后 ， 
我 们 在 第 1.5 节 简 要 回顾 了 操作 系统 的 发 展 历程 ， 并 在 第 1.6 节 对 本 章 内 容 进 行 了 总 结 。 


1.1 .引言 


许多 年 以 来 ， 除 了 操作 系统 编程 人 员 和 计算 机 迷 以 外 ， 大 多 数 人 对 操作 系统 并 不 感 兴 
趣 。 近 几 年 ， 由 于 数 起 备 受 瞩 目的 事件 , “操作 系统 ”偶尔 也 会 出 现在 头 版 新 闻 中 。 突 然 间 ， 
就 有 人 认为 操作 系统 可 以 控制 所 有 计算 。 人 们 开始 对 操作 系统 的 好 坏 评 头 论 足 ， 甚 至 出 现 
了 非常 强烈 的 不 同意 见 ， 同 时 也 对 操作 系统 应 当 提供 哪些 功能 产生 了 相当 大 的 分 歧 。 许 多 
人 (包括 一 些 法 院 ) 认为 某 家 公司 支配 着 操作 系统 市 场 ， 而 还 有 一 些 人 则 宣称 操作 系统 正 逐 
渐变 得 不 再 重要 ， 因 为 他 们 认为 互联 网 浏览 器 ( Internet browser) 就 是 操作 系统 。 但 事实 上 ， 
操作 系统 的 范畴 已 变 得 非常 宽泛 ， 类 型 也 日 渐 多 一 一 
样 化 ， 它 生存 在 科 基 一 胡可 以 想到 的 【和 包 播 -一 下 和 人 十 林 和 作 生 合作 洒 作 的 和 
可 能 使 许多 人 吃惊 的 ) 计算 设备 的 某 个 层级 上 。 。 -至上 电脑 
例如 ， 手 持 式 个 人 数字 助理 (Personal Digital 有线 电 视 机 顶 合 

Assistant，PDA) 或 称 为 学 上 电脑 就 拥有 功能 强 -电子 游戏 机 

大 的 、 复 杂 但 灵活 的 操作 系统 。 而 且 ， 大 多 数 智 ”复印 机 

能 型 电子 设备 都 拥有 复杂 但 简单 易 用 的 操作 系统 传真 机 

和 系统 软件 来 控制 自身 。 一 度 被 认为 是 神秘 的 进 遥控 器 

程 管理 和 内 存 管理 技术 的 操作 系统 ， 现 在 偶尔 也 ”手机 

会 成 为 咖啡 馆 、 酒 吧 或 计算 机 商店 的 一 个 话题 。 汽车 发 动机 

当下 ， 许 多 人 看 起 来 都 是 专家 ， 或 者 至 少 对 操作 数码 相机 
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系统 有 自己 的 观点 。 

尽管 我 们 也 有 自己 的 看 法 ,不 过 ,为 了 能 够 更 好 地 解释 实际 的 系统 ， 我 们 尝试 摆脱 自 
以 为 是 的 市 场 营 销 人 员 以 及 数 以 百 万 计 的 用 户 的 哈 器 ， 深 入 背后 去 寻找 真 诺 。 当 然 ， 一 且 需 
要 ， 我 们 也 会 抛 出 自己 的 看 法 ， 并 且说 明 我 们 持 有 相应 观点 的 理由 。 我 们 通过 列举 许多 现在 
使 用 的 系统 实例 来 展示 有 关 概 念 ， 并 就 五 花 八 门 的 系统 ， 进 一 步 说 明 什么 才 是 好 的 而 什么 才 
是 差 的 。 我 们 努力 回避 较真 的 议题 ， 辟 如: “ Windows 操作 系统 与 Mac 操作 系统 相 比 ， 哪 个 
操作 系统 更 好 ?” 或 “是 否 UNIX 和 它 的 变种 (如 Linux) 都 要 强 于 上 述 两 种 操作 系统 ?” 相 
反 ， 我 们 重点 讨论 这 些 系 统 是 如 何 产 生 的 以 及 它们 为 用 户 和 编程 人 员 提 供 了 什么 。 

伴随 时 代 的 进步 ， 操 作 系统 的 特定 部 分 一 一 特别 是 那些 处 理 用 户 和 应 用 程序 间 交 互 的 部 
分 一 一 被 越 来 越 多 的 用 户 和 编程 人 员 看 透 或 搞 清 楚 ， 并 成 为 计算 机 (或 电子 设备 甚至 机 械 设 
备 ) 销售 时 的 关键 因素 。 买 主 们 正 变 得 越 来 越 挑 易 ， 对 操作 系统 应 当 提 供 的 品质 也 寄予 更 高 
的 期 望 。 同 以 往 任何 时 候 相 比 ， 不 仅 要 求 系统 必须 在 新 功能 和 简单 易 用 方面 提供 更 多 支持 ， 
同时 还 要 求 系统 必须 支持 那些 我 们 已 经 习惯 了 的 许多 旧 的 功能 和 应 用 程序 。 理 所 当然 ， 当 我 
们 增加 了 诸如 视频 设备 和 磁盘 、 高 保 真 音 响 以 及 无 线 网 络 等 新 设备 时 ， 我 们 希望 系统 能 够 很 
容易 地 适应 和 处 理 这 些 设备 。 事 实 上 ,一 种 好 的 操作 系统 体系 结构 甚至 应 该 支持 操作 系统 构 
建 时 尚未 出 现 的 甚至 可 能 还 没有 想到 的 新 设备 的 连接 ! 


1.2 ”什么 是 操作 系统 


在 本 节 ， 我们 将 通过 一 个 简单 的 例子 ( 即 简 单 的 手持 式 游戏 系统 ) 来 具体 说 明 操 作 系 统 
应 当 提 供 的 一 些 基 本 功能 。 

设想 一 个 非常 便宜 ,但 是 配备 有 一 个 小 型 显示 屏 、 几 个 按键 和 若干 游戏 的 那 种 手持 式 
电子 游戏 系统 。 虽 然 这 类 游戏 系统 可 能 并 不 一 定 需要 操作 系统 ， 但 是 ， 它 也 可 能 拥有 操作 系 
统 ， 其 主要 理由 在 于 可 以 把 安装 在 游戏 系统 上 的 各 种 不 同 游戏 所 需要 的 公共 功能 模块 整合 到 
一 起 和 统一 管理 。 

通常 ， 游 戏 都 有 一 些 共 同 的 模块 。 例 如 ， 每 款 游 戏 都 需要 通过 按键 来 获取 输入 ， 也 需要 
在 屏幕 上 显示 什么 东西 。 尽 管 这 些 动作 听 起 来 很 容易 ， 不 过 ， 它 们 确实 需要 一 些 并 不 那么 简 
单 的 软件 编程 。 从 一 个 按键 获取 相应 的 输入 ， 听 起 来 简单 极 了 。 那 么 ， 要 是 用 户 一 次 同时 按 
下 两 个 按键 ， 会 发生 什么 ?或 者 说 应 该 如 何 处 理 呢 ?另外 ， 一 款 廉 价 游戏 有 可 能 并 不 使 用 复 
杂 、 昂 贵 的 按键 ,为 此 ， 就 可 能 会 发 生 扭曲 传人 信号 的 电子 噪声 。 游 戏 系统 又 该 如 何 对 此 进 
行 处 理 呢 ?简单 的 解决 方案 是 ， 对 每 一 项 这 样 的 公共 问题 均 分 别 放 在 唯一 的 某 处 地 方 进行 处 
理 。 例 如 ， 可 以 把 所 有 按键 操作 的 读 取 、 噪 声 清理 等 放 在 一 个 独立 的 软件 例 程 中 。 设 立 唯 一 
的 read-the-button 软件 例 程 ， 具 有 提供 一 致 性 用 户 接口 的 优势 ， 也 就 是 说 ， 所 有 游戏 均 以 相 
同 的 方式 处 理 按键 输入 操作 。 同 时 ， 相 应 例 程 仅 需 占 用 系统 内 存 中 唯一 的 一 片 空间 ， 而 不 是 
在 每 款 游 戏 中 都 占有 空间 。 进 一 步 问 ，read-the-button 软件 例 程 应 当 被 放 到 什么 地 方 呢 ? 答 
案 是 ， 应 当 放 到 操作 系统 中 。 这 样 ， 每 款 需要 读 取 按 键 的 游戏 就 都 能 够 调用 到 该 例 程 。 

操作 系统 还 应 当 处 理 异 常事 件 。 例 如 ， 一 个 用 户 可 能 在 玩 游戏 过 程 中 退出 游戏 〈 当 失败 
时 )， 并 启动 另外 一 场 游戏 。 重 启 游 戏 系 统 不 应 该 是 必需 的 ， 用 户 在 游戏 (任务 ) 之 间 进 行 切 
换 是 非常 自然 和 预料 中 的 事 。 事 实 上 , (5 岁 的 ) 用 户 可 能 在 不 经 意 的 时 候 按 下 按键 ,而 当 游 
戏 正 在 进行 的 时 候 (甚至 当 等 待 按键 按 下 的 时 候 )， 屏 幕 应 当 持 续 被 更 新 〈 刷 新 )。 这 称 之 为 
异步 性 (asynchronicity)， 通 俗 而 言 ， 就 是 指 事件 随机 发 生 或 在 不 可 预知 的 时 间 发 生 。 即 便 


[5 ] 


4 沉 一 部 分 打 作 系统 元 述 


像 手持 式 游 戏 之 类 的 简单 系统 ， 也 体现 出 异步 性 这 一 非常 重要 的 特征 。 

一 些 重要 的 操作 系统 概念 已 经 融入 该 游戏 系统 中 : 当 一 场 游 戏 被 启动 时 ， 其 部 分 软件 模 
块 可 能 被 加 载 进 内 存 ， 而 其 他 部 分 则 可 能 已 经 被 提前 预 装 到 了 只 读 存 储 器 ( Read-Only 
Memory，ROM) 或 固定 存储 器 S 中 ; 动态 内 存 被 保留 下 来 ， 以 备 游戏 使 用 ， 并 且 进行 了 初 
始 化 ; 定时 器 则 可 能 进行 了 设 定 。 所 有 这 些 都 出 现在 了 一 款 尽 管 便宜 但 却 有 趣 的 游戏 上 ! 你 
对 操作 系统 还 有 什么 其 他 的 期 待 呢 ? 


1.3 ”操作 系统 的 用 户 视 图 和 系统 视图 


你 或 许 听 说 过 那 句 古老 的 谚语 :“ 每 个 问题 都 有 两 面 性 。”( 或 许 准确 地 讲 ， 应当 是 “两 
面 性 或 多 面 性 ”。) 其 大 意 是 ， 就 某 些 问题 来 说 ， 如 果 试 着 从 不 同 的 角度 去 观察 ， 往 往 有 助 于 
我 们 更 好 地 理解 这 些 问题 。 为 此 ， 从 不 同 的 角度 来 观察 和 审视 事物 成 为 学 习 新 东西 的 重要 
方法 之 一 。 对 于 操作 系统 而 言 ， 两 种 最 重要 的 透视 图 就 是 用 户 视图 ( user view) 和 系统 视图 
(system view )。 

用 户 视图 属于 用 户 或 程序 (注意 ,程序 是 操作 系统 的 主要 使 用 者 ) 如 何 利用 操作 系统 的 
范畴 。 例 如 ， 程 序 是 如 何 (通过 操作 系统 来 ) 读 取 按 键 操 作 信息 的 。 系 统 视 图 则 属于 操作 系 
统 软件 如 何 实施 完成 相关 要 求 动作 的 范畴 。 拿 刚才 的 例子 来 讲 ， 就 是 说 操作 系统 是 如 何 获取 
按键 操作 信息 ， 进 而 分 离 出 特定 的 按键 操作 (如 shift 按键 操作 ) 并 使 之 能 够 被 用 户 或 程序 所 
接受 的 。 贯 穿 整 部 教材 ， 我 们 将 同时 从 用 户 和 系统 两 方面 来 阐明 操作 系统 的 相关 机 制 、 概 念 
和 技术 。 接 下 来 ,我们 首先 详细 阐述 不 同类 型 的 用 户 及 他 们 对 操作 系统 的 认识 。 


1.3.1 用 户 视图 及 用 户 分 类 


用 户 一 词 经 常 太 过 含糊 不 清 ， 尤 其 是 对 于 那些 在 计算 中 扮演 重要 角色 的 人 。 所 以 ， 首 先 
把 各 种 不 同类 型 的 用 户 描述 清楚 就 显得 格外 重要 。 然 而 ， 尝 试 确定 操作 系统 的 某 个 用 户 的 角 
色 并 不 那么 简单 ， 因 为 存在 五 花 八 门 、 各 式 各 样 的 用 户 。 在 此 ,我 们 主要 想 把 终端 用 户 、 应 
用 程序 员 、 系 统 程序 员 和 系统 管理 员 区 分 开 来 。 表 1-1 就 上 述 4 种 主要 类 型 的 用 户 各 自分 别 
关切 的 最 重要 问题 进行 了 简明 扼要 的 说 明 。 当 然 ， 这 些 问 题 之 间 难 免 会 存在 一 些 重 倒 。 我 们 
只 是 试图 把 有 些 时 候 发 生 分 歧 的 那些 观点 客观 地 展现 出 来 。 更 为 复杂 的 情况 是 ， 有 时 用 户 可 
以 同时 归 到 若干 角色 类 型 甚至 所 有 角色 类 型 上 。 而 这 样 的 用 户 往往 会 发 现 自己 拥有 相互 矛盾 
或 冲突 的 需求 。 

应 用 型 用 户 (application user) 或 称 作 终端 用 户 〈end user) 一 一 这 类 用 户 包括 全 部 即 所 
有 使 用 (或 运行 ) 应 用 程序 或 系统 程序 的 人 。 当 我 们 使 用 字 处 理 软件 、 网 络 浏览 器 、 电 子 邮 
件 系统 或 多 媒体 播放 器 时 ， 我 们 是 相应 的 应 用 程序 的 使 用 者 。 作 为 用 户 ， 我 们 期 望 系统 (对 
按键 或 鼠标 移动 ) 能 够 做 出 快捷 、 可 靠 的 响应 ， 提 供 一 致 的 用 户 视图 (也 就 是 说 ， 能 够 对 诸 
如 屏幕 滚动 、 应 用 程序 退出 等 各 种 类 型 的 命令 分 别 采 取 按 类 统一 的 类 似 执行 方式 )， 以 及 依 
赖 于 各 种 特定 类 型 的 操作 系统 的 其 他 特征 。 我 们 在 表 1-1 中 列 出 了 其 他 的 需求 内 容 。 总 的 来 
说 ， 这 类 用 户 时 常 只 是 被 简单 地 称 作 用 户 ， 有 时 也 被 称 作 终端 用 户 。 

应 用 程序 员 ( application programmer) 一 一 这 类 用 户 包括 编写 字 处 理 软件 或 电子 邮件 系 
统 等 各 种 应 用 程序 的 人 。 一 般 而 言 ， 编 程 人 员 对 操作 系统 的 要 求 往 往 比 较 苛 刻 。 当 他 们 学 


日 ”我们 将 会 在 第 2 章 和 第 3 章 中 定义 这 些 术 语 。 


习 使 用 一 种 新 的 操作 系统 时 ， 经 常会 提 及 “我 如 何 对 一 个 文件 进行 读 写 ?”、“ 我 如 何 接收 到 
用 户 的 按键 操作 信息 ?” 以 及 “我 如 何 显 示 这 个 方 框 ?” 等 诸如 此 类 的 问题 。 操 作 系 统 提供 
的 实施 机 制 就 是 程序 设计 人 员 的 操作 系统 视图 。 有 时 它们 被 称 作 系统 调用 或 应 用 程序 接口 
(Application Program Interface，API)。 它 们 也 可 能 呈现 为 编程 语言 库 函 数 ， 有 时 或 者 就 是 类 
包 。 程序 设计 人 员 还 要 求 他 们 开发 的 软件 可 以 简单 方便 地 移植 到 其 他 平台 上 。 

系统 程序 员 ( system programmer) 指 那些 编写 与 操作 系统 紧密 相连 的 软件 或 模块 的 
人 。 用 于 显示 计算 机 网 络 连接 状态 的 实用 例 程 或 可 安装 的 硬件 驱动 程序 均 为 系统 程序 的 具体 
例子 。 系 统 程序 员 需 要 详细 了 解 操 作 系统 的 内 部 功能 机 制 。 许 多 情况 下 ， 系 统 程序 需要 访问 
特殊 的 操作 系统 数据 结构 或 特权 性 质 的 系统 调用 。 尽 管 操作 系统 设计 人 员 有 时 也 会 关心 移植 
到 其 他 平台 的 需求 ， 但 他 们 通常 对 此 并 不 十 分 关注 ， 他 们 承担 的 往往 是 针对 特定 平台 开发 特 
定 功 能 集合 的 任务 ， 故 而 不 是 很 关心 可 移植 性 。 

系统 管理 员 ( system administrator) 这 类 用 户 包 括 管理 计算 机 设施 ， 因 而 负责 安装 
和 升级 操作 系统 以 及 其 他 系统 程序 与 实用 例 程 的 人 员 。 他 们 也 负责 用 户 账户 的 创建 和 管理 以 
及 系统 的 保护 。 他 们 需要 详细 了 解 像 “ 如 何 安装 和 升级 操作 系统 ”“ 操 作 系 统 与 其 他 程序 和 
实用 例 程 之 间 如 何 进行 交互 ”等 具体 事项 。 为 了 有 效 地 保护 系统 和 用 户 ， 他 们 也 必须 了 解 操 
作 系 统 的 安全 和 授权 功能 。 








表 1-1 不 同类 型 用 户 的 关注 取向 


简单 易 用 且 方 便 上 手 

适应 用 户 操作 习惯 

实时 响应 输入 操作 

提供 丰富 的 可 视 化 提示 信息 

避免 令 人 不 快 的 意外 事件 ( 璧 如， 在 没有 警告 的 前 提 情 况 下 删除 了 一 个 文件 ) 

采取 统一 的 方式 处 理 相同 的 事情 (譬如 ,在 不 同 的 场景 中 移动 一 个 图 标 或 向 下 翻 卷 一 个 窗口 ， 则 
移动 图 标的 处 理 基 本 一 致 ， 翻 卷 窗口 的 处 理 亦 基 本 一 致 ) 

为 完成 同一 件 事 提供 其 他 备 选 方案 (譬如 ， 有 的 用 户 喜 欢 使 用 鼠标 ， 而 有 的 用 户 则 喜欢 使 用 键盘 ) 


方便 程序 访问 低级 的 操作 系统 调用 (譬如 ， 读 取 按 键 、 绘 制 屏幕 、 获 取 鼠 标 位 置 ) 

提供 整个 系统 的 一 致 性 的 程序 员 视图 

方便 使 用 高 级 的 操作 系统 机 制 和 服务 〈 警 如 ， 创 建新 的 窗口 、 读 取 网 络 信息 、 写 人 网 络 信息 ) 
针对 其 他 平台 的 可 移植 性 


方便 创建 正确 的 程序 
方便 调试 确定 程序 问题 
方便 维护 程序 

方便 扩展 现 有 程序 


方便 添加 或 移 除 诸如 磁盘 、 扫 描 仪 、 多 媒体 配件 、 网 络 连接 部 件 等 设备 
提供 操作 系统 安全 服务 来 保护 用 户 、 系 统 和 数据 文件 

方便 升级 到 新 的 操作 系统 版 本 

方便 创建 和 管理 用 户 账户 

平均 响应 时 间 表 现 不 错 且 可 预期 

系统 价格 可 以 负担 得 起 


1.3.2 ”系统 视图 

系统 视图 是 指 操作 系统 如 何 提供 服务 。 换 句 话说 ， 其 涉及 操作 系统 的 内 部 工作 机 制 。 这 
是 一 个 不 太 常见 的 视图 。 通 常 只 有 一 少 部 分 人 ， 即 操作 系统 的 设计 者 和 实现 者 ,真正 了 解 或 
关心 操作 系统 的 内 部 工作 机 理 。 事 实 上 ， 相 关 信 息 往 往 被 生产 和 销售 操作 系统 的 公司 视 作 商 


终端 用 户 


应 用 程序 员 


系统 程序 员 


系统 管理 员 


6 ”第 一 部 分 所 作 承 统 桩 过 


业 机 密 。 有 了 时， 文件 管理 、 程 序 运行 或 内 存 处 理 等 系统 主要 组 成 部 分 的 总 体 工作 机 理 可 能 被 
描述 和 呈现 出 来 ， 以 帮助 程序 员 更 好 地 理解 相关 子 系统 的 使 用 。 某 些 情况 下 ， 整 个 操作 系统 
的 源 程序 代码 甚至 可 以 被 获取 到 。 这 样 的 系统 被 称 作 开源 系统 (open source system) 9。 

本 书 的 大 部 分 内 容 主 要 关注 如 何 这 一 性 质 ， 即 系统 如 何 运行 一 个 程序 、 如 何 创 建 一 个 文 
件 、 如 何 显示 一 幅 图 形 ， 等 等 。 为 了 能 够 解释 清楚 真正 的 “如 何 ”问题 的 内 部 细节 ， 我 们 在 
书 中 就 实现 操作 系统 功能 的 若干 算法 及 可 选 方法 进行 了 介绍 和 描述 。 下 面 ， 我 们 将 通过 跟踪 
鼠标 和 光标 的 移动 及 管理 文件 操作 两 个 例子 ， 来 具体 说 明 系 统 视 图 (或 视图 )。 虽 然 这 些 例 
子 看 起 来 可 能 有 点 复杂 ,但 它们 确实 可 以 说 明 操 作 系 统 是 如 何 真 正 参 与 计算 机 用 户 所 执行 的 
所 有 操作 活动 的 。 


1.3.3 ”一 个 例子 : 移动 鼠标 (和 鼠标 指针 ) 


尽管 通过 移动 鼠标 (或 其 他 某 类 指针 式 设备 ， 壁 如 触 控 板 或 轨迹 球 ) 来 移动 屏幕 上 的 鼠 
标 指针 (或 光标 ( cursor) ) 的 过 程 看 起 来 直截了当 ， 然 而 其 却 可 以 例证 出 操作 系统 的 许多 视 
图 。 图 1-1 具体 说 明 这 一 过 程 。 当 指针 式 设 备 被 移动 时 ， 将 触发 一 种 由 操作 系统 负责 处 理 的 
所 谓 中 断 (interrupt) 的 硬件 事件 。 操 作 系统 根据 某 种 硬件 专用 的 单位 ( 即 产生 的 脉冲 数 ， 而 
非 毫米 或 英寸 数 ) 来 记录 鼠标 的 移动 。 这 是 一 种 低级 系统 视图 ( low-level system view)。 读 
取 鼠 标 移动 的 实际 软件 是 操作 系统 的 组 成 部 分 ， 称 为 鼠标 驱动 程序 ( mouse device driver)。 
该 设备 驱动 程序 读 取 低级 别 的 鼠标 移动 信息 ， 并 由 操作 系统 的 其 他 模块 对 相关 信息 进行 解释 
和 转换 为 高 级 系统 视图 (higher-level system view)， 壁 如 反映 鼠标 移动 的 屏幕 坐标 。 





图 1-1 光标 对 鼠标 移动 的 跟踪 
为 一 方面 ， 或 在 其 他 的 视图 上 ， 是 关于 “用 户 看 到 的 是 什 么 ?” 的 问题 。 在 用 户 视图 中 ， 
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光标 将 在 屏幕 上 快速 地 移动 ， 而 且 ， 如 果 鼠 标 以 较 快 速度 移动 较 远 距离 ， 那 么 其 在 屏幕 上 
的 移动 看 起 来 也 会 加 快 很 多 。 在 这 些 视图 之 间 是 应 用 程序 员 视 图 ( application programmers” 
view)， 即 “在 我 的 应 用 程序 里 ， 如 何 获 取 鼠 标 移动 信息 就 可 以 利用 它 和 显示 它 ?” 另 外 一 个 
问题 是 ,“ 鼠 标 移 动 的 信息 如 何 提交 给 应 用 程序 员 ?” 这 属于 前 面 提 到 的 高 级 系统 视图 的 范畴 。 

让 我 们 结束 这 些 视图 的 讨论 ， 重 新 回 到 系统 视图 上 来 。 如 果 存 在 多 个 打开 的 窗口 ， 则 哪 
个 应 用 程序 应 当 接 收 当前 的 鼠标 移动 操作 ? 进一步 说 ， 如 果 在 应 用 程序 获取 相关 操作 信息 之 
前 发 生 过 多 次 鼠标 移动 操作 ， 则 这 些 移动 操作 可 能 需要 进行 排队 处 理 。 还 有 ， 如 果 操 作 系 统 
正在 忙于 处 理 其 他 事务 (例如 ， 通 过 网 络 连 接 加 载 网 页 )， 故 而 无 法 及 时 地 接收 设备 驱动 输 
入 ,那么 鼠标 移动 信息 有 可 能 丢失 。 


1.3.4 另 一 个 比较 大 的 例子 : 文件 


有 时 ， 操 作 系统 的 最 重要 的 终端 用 户 视 图 是 文件 系统 ， 尤 其 是 文件 名 。 文 件 名 能 包含 
空格 吗 ? 它们 可 以 有 多 长 ? 是 否 支 持 大 小 写字 母 ? 它们 按 不 同 的 字符 还 是 相同 的 字符 进行 处 
理 ? 非 英文 字符 或 标点 呢 ? 一 种 操作 系统 甚至 可 能 仅仅 因为 不 能 使 用 长 文件 名 或 不 区 分 大 小 
写字 母 就 被 评判 为 好 或 者 坏 。 

在 应 用 程序 员 视 图 中 ,文件 系统 是 频繁 使 用 的 关键 系统 部 分 ， 其 提供 新 文件 创建 、 现 
有 文件 使 用 、 文 件数 据 读 、 添 加 数据 到 文件 以 及 其 他 文件 操作 等 相关 指令 。 系 统 甚至 可 能 提 
供 若干 不 同类 型 的 文件 支持 。 鉴 于 文件 系统 的 系统 视图 比较 庞大 ， 所 以 其 通常 被 划分 为 如 下 
几 个 部 分 : 文件 命名 和 名 字 处 理 (目录 服务 )、 文 件 定位 及 映射 文件 名 到 对 应 数据 等 文件 服 
务 (文件 分 配 和 存储 )、 尝 试 把 打开 文件 的 部 分 数据 保存 在 内 存 中 以 提高 数据 访问 速度 ( 文 


件 缓冲 和 高 速 缓存 )、 存 储 设备 的 实际 管理 (磁盘 。 表 1.2 从 光盘 复制 文件 到 硬盘 的 步 中 


调度 )。 
例如 ， 假 定 某 用 户 要 输入 文件 名 以 把 相应 文 
件 从 光盘 复制 到 硬盘 。 程 序 可 能 首先 需要 检查 该 


检查 该 文件 在 光盘 上 是 否 存在 
检查 硬盘 上 对 应 文件 一 一 确认 可 以 窗 盖 


文件 在 光盘 上 是 否 存 在 以 及 其 可 否 覆 盖 硬盘 上 对 -在下 过 的 日 水 中 创建 对 应 次 文中 名 的 日 杂 现 


应 文件 名 的 文件 。 然 后 ， 操 作 系统 需 要 在 硬盘 的 在 硬盘 上 查找 空间 以 存放 文件 

目录 中 为 该 文件 创建 一 个 目录 项 ;在 硬盘 上 查找 。 从 光盘 上 读 取 数据 肩 区 

空间 用 于 存放 数据 ; 从 光盘 上 查找 和 获取 待 复制 写 数据 到 硬盘 扇 区 

的 数据 片断 〈 扇 区 )。 而 且 ， 所 有 这 一 切 应 当 在 几 ”更 新 硬盘 目录 

秒 甚至 不 到 一 秒 的 时 间 内 全 部 完成 ! 参见 表 1-2 ”更 新 硬盘 空间 信息 

所 示 。 在 几 秒 (甚至 更 少 ) 的 时 间 内 全 部 完成 这 些 操作 


1.4 操作 系统 的 一 些 术语 、 基 本 概念 和 图 解 

接 下 来 ， 我 们 首先 列举 和 定义 一 些 重要 的 操作 系统 概念 和 术语 。 然 后 ， 再 通过 一 些 图 示 
来 进一步 阐明 这 些 概念 。 
1.4.1 基本 术语 


操作 系统 (或 简称 为 系统 ) : 虽然 我 们 能 够 基于 操作 系统 的 不 同 视图 给 出 其 不 同 的 定义 ， 
但 是 下 面 的 非 正式 定义 将 是 一 个 很 好 的 起 点 : 操作 系统 是 管理 与 控制 计算 机 资源 或 者 其 他 计 
算 设 备 或 电子 设备 ， 并 为 用 户 和 程序 使 用 这 些 资源 提供 接口 的 一 个 或 多 个 软件 模块 组 成 的 集 
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合 。 这 些 被 管理 的 资源 包括 内 存 、 处 理 器 、 文 件 、 输 入 或 输出 设备 ， 等 等 。 

设备 (device) : 设备 是 指 与 计算 机 主机 系统 相连 接 的 硬件 。 硬 盘 、 光 驱 和 视频 监视 器 是 
操作 系统 管理 的 典型 设备 。 许 多 设备 需要 专用 的 电子 (硬件 ) 接口 ， 称 为 设备 控制 器 (device 
controller)， 用 于 辅助 设备 或 一 组 相似 设备 连接 到 计算 机 系统 上 。 相 关 例 子 包 括 硬盘 控制 器 
和 视频 监视 器 控制 器 ， 其 中 ， 硬 盘 控 制 器 拥有 许多 类 型 ， 并 通常 遵循 如 小 型 计算 机 系统 接口 
(Small Computer System Interface，SCSI)、 串 行 高 级 技术 连接 ( Serial Advanced Technology 
Attachment，SATA， 或 串 行 ATA) 接口 以 及 其 他 常见 但 用 神秘 缩写 字母 序列 命名 的 行业 标 
准 。 此 外 ， 作 为 把 设备 连接 到 主机 系统 的 硬件 黏合 部 件 ， 设 备 控制 器 与 主机 系统 之 间 通 常 以 
总 线 (bus) 相连 接 。 

设备 驱动 程序 ( device driver) : 设备 驱动 程序 是 组 成 操作 系统 的 软件 例 程 ， 用 于 实现 设 
备 〈 经 由 相应 设备 控制 器 ) 的 通信 和 控制 。 

内 核 (kernel) : 该 术语 常常 指 操作 系统 中 实现 基本 功能 且 常 驻 内 存 的 组 成 部 分 。 某 些 情 
况 下 ， 整 个 操作 系统 被 构建 为 一 个 整体 并 被 统称 为 内 核 。 

服务 (service): 服务 是 指 操 作 系 统 内 核 为 用 户 提 供 的 功能 ， 大 部 分 采用 应 用 程序 编程 接 
口 (Application Programming Interface，API) 或 操作 系统 调用 方式 。 这 些 服务 根据 对 应 的 功 
能 可 以 方便 地 分 组 归 类 ， 例 如 ,文件 操作 服务 (创建 、 读 复制 )、 内 存 分 配 服 务 (申请 、 释 
放 ) 或 其 他 杂项 服务 (获取 系统 时 间 ) 等 。 程 序 设计 人 员 了 解 和 通晓 一 个 系统 的 关键 就 在 于 
搞 清楚 其 所 提供 的 有 关 操 作 系 统 服 务 。 

实用 例 程 (utility) : 这 些 程 序 不 属于 操作 系统 的 核心 部 分 ( 即 内 核 ), 但 与 内 核 密切 
协作 ， 从 而 可 以 简化 系统 信息 的 使 用 或 访问 。 外 壳 程 序 ( shell) 或 命令 解释 器 ( command 
interpreter) 属于 实用 例 程 。 外 壳 程 序 提供 了 用 户 访问 许多 系统 服务 的 接口 。 例 如 ， 诸 如 显 
示 一 个 目录 的 文件 列表 、 和 运行 一 个 程序 或 退出 (注销 )， 均 可 能 由 外 壳 程 序 负责 处 理 。 外 壳 
程序 也 可 以 调用 其 他 实用 例 程 具体 完成 特定 功能 。 例 如 ， 有 些 时 候 ， 目 录 文 件 列表 显示 自身 
就 是 一 个 实用 例 程 。 


1.4.2 ”这 些 图 片 说 明了 什么 


图 1-2 是 一 台 小 型 的 个 人 计算 机 的 简化 示意 图 ， 反映 了 一 些 基 本 的 设备 同 计算 机 内 存 和 
处 理 器 之 间 的 连接 关系 。 操 作 系统 程序 (或 内 核 ) 会 包括 许多 不 同 的 设备 驱动 程序 ， 用 于 负 
责 管理 处 理 器 控制 下 的 系统 外 围 设 备 。 例 如 ， 部 分 内 存 中 存放 的 数据 内 容 可 能 会 被 传输 给 视 
频 控 制 器 ， 进 而 被 显示 在 监视 器 上 ; 而 磁盘 ( 扇 区 ) 的 部 分 内 容 也 可 能 会 被 传输 给 磁盘 控制 
器 ， 并 最 终 交 付 给 内 存 (对 于 磁盘 读 操作 而 言 )。 

图 1-3 是 操作 系统 的 简易 示意 图 。 操 作 系 统 控 制 (或 管理 ) 系统 资源 ， 包 括 : 控制 磁盘 、 
键盘 、 视 频 监视 器 及 其 他 设备 ; 通过 决定 哪 一 个 程序 启动 运行 来 控制 对 内 存 的 分 配 和 对 处 理 
器 的 使 用 ; 采用 系统 调用 方式 为 外 壳 程 序 及 其 他 程序 提供 服务 ; 通过 把 硬件 设备 的 复杂 细节 
隐藏 起 来 ， 以 实现 与 程序 之 间 的 隔离 ， 从 而 提供 了 硬件 抽象 。 

图 1-3 经 常用 来 描述 操作 系统 ， 但 它 只 是 逻辑 视图 ， 而 非 物理 视图 。 例 如 ， 物 理 上 而 
言 ， 操 作 系统 内 核 驻 留 在 内 存单 元 并 运行 (或 执行 ) 在 处 理 器 上 。 故 而 ， 内 核 (本 身 是 软件 ) 
与 设备 (本身 是 硬件 ) 之 间 的 箭头 表示 逻辑 控制 ， 而 非 物理 控制 。 

图 1-4 为 操作 系统 的 分 层 视图 。 最 外 层 代 表 实 用 例 程 / 应 用 程序 层 ， 它 们 访问 操作 系统 
内 核 屋 ， 而 后 者 反 过 来 又 管理 对 硬件 层 的 访问 。 





图 1-2 硬件: 一 台 小 型 的 个 人 计算 机 的 简化 示意 图 
注 : 这 幅 图 太 过 简单 了 。 实 际 上 ， 常 常 有 多 条 总 线 ， 比 如 说 视频 与 内 存 之 间 。 我 们 将 在 附录 中 给 出 更 详细 的 图 示 。 





图 1-3 ”操作 系统 软件 与 硬件 间 关 系 的 简易 示意 图 图 1-4 操作 系统 的 分 层 视 图 


1.4.3 ” 走 近 真 实 : 个 人 计算 机 操作 系统 


图 1-5 展示 出 一 台 个 人 计算 机 ( Personal Computer，PC) 的 操作 系统 的 更 多 的 细节 。 该 
操作 系统 拥有 两 项 在 图 1-3 中 没有 标 出 的 其 他 模块 ， 即 设备 驱动 程序 和 基本 输入 / 输出 系统 
(Basic Input/Output System，BIOS )。 基 本 输入 /输出 系统 对 硬件 进行 了 抽象 。 换 名 话说 ， 基 
本 输入 /输出 系统 负责 管理 如 键盘 、 基 本 视频 和 系统 时 钟 等 常见 设备 。 这 样 做 可 以 支持 操作 
系统 主体 或 高 级 部 分 采用 相同 的 方式 来 处 理 相同 类 型 的 设备 (如 所 有 的 键盘 )。 于 是 ， 无 论 
键盘 有 88 个 按键 、112 个 按键 还 是 其 他 数量 的 按键 ， 甚 至 对 于 由 于 不 同 语言 字符 或 重音 键 
而 可 能 出 现在 不 同 键盘 上 的 按键 没有 出 现 的 情况 ， 操 作 系统 内 核 都 无 须发 生 改变 。 设 备 驱 动 
程序 也 对 相似 的 设备 提供 了 类 似 的 抽象 。 例 如 ， 数 字 化 视频 光盘 的 设备 驱动 程序 可 以 由 设备 
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制造 商 提供 ， 并 对 操作 系统 提供 光盘 设备 的 抽象 或 公共 视图 ， 所 以 操作 系统 可 以 不 考虑 制造 
商 ， 也 无 须 跟着 每 一 款 特殊 的 光盘 驱动 设备 
而 发 生 改 变 。 

下 一 节 将 就 “操作 系统 设计 时 ， 为 什么 
设立 抽象 层 非常 重要 ? ”的 问题 展开 进一步 的 
深入 探讨 。 

1.4.4 为 什么 设立 抽象 层 

为 什么 要 设立 抽象 层 呢 ?这 是 一 个 很 好 
的 问题 。 在 个 人 计算 机 的 早期 计算 机 玩家 
一 度 沉浸 在 因 组 装 和 构建 硬件 以 及 让 简单 程 
序 工作 起 来 而 带 来 的 乐趣 之 中 。 这 些 程 序 通 
常 采 用 汇编 语言 或 机 器 语言 编写 。 对 于 某 些 
人 来 讲 ， 这 些 语言 已 经 够 得 上 不 错 的 学 习 工 
具 ， 然 而 相关 编程 确实 非常 元 长 、 枯 燥 和 乏 
味 。 即 便 如 此 ， 人 们 希望 享受 编写 更 有 趣 因而 更 长 、 更 复杂 的 程序 的 经 验 。 于 是 ,更 好 的 工 
具 不 可 或 缺 。 这 样 的 工具 包括 简单 易 用 的 编辑 器 和 面向 特定 高 级 程序 设计 语言 的 编译 器 或 解 
释 器 。 对 于 终端 用 户 而 言 ， 则 渴望 把 计算 机 当 作 商业 或 生产 工具 来 使 用 。 这 些 用 户 需要 文字 
处 理 、 电 子 表格 和 通信 软件 。 与 此 同时 ， 许 多 非常 不 同 的 计算 机 硬件 系统 正在 建设 当中 。 当 
然 ， 也 有 一 些 相似 的 但 并 非 完 全 相同 的 由 诸多 制造 厂商 构建 的 计算 机 。 这 些 系统 或 者 可 能 拥 
有 相同 的 处 理 器 制造 厂商 制造 的 相同 的 处 理 器 ， 或 者 使 用 了 拥有 相同 指令 集 的 兼容 的 处 理 
器 。 但 是 ， 它 们 可 能 拥有 全 然 不 同 的 视频 设备 。 例 如 ， 一 个 系统 可 能 拥有 一 台 终 端 一 样 的 设 
备 连 接 在 串口 上 ， 而 另 一 个 系统 则 拥有 提供 许多 高 级 图 形 处 理 能 力 的 内 散 式 视频 控制 器 。 对 
于 键盘 而 言 ， 主 要 区 别 则 往往 体现 在 功能 键 或 “箭头 ”或 光标 移动 键 ， 以 及 其 他 键 的 增加 或 
缺失 等 方面 。 

为 了 使 程序 员 能 够 创建 在 这 些 不 同系 统 上 运行 的 程序 ， 而 且 当 程序 在 不 同系 统 间 移 植 时 
仅 需 很 少 变动 甚至 无 须 任何 修改 ， 操 作 系统 为 其 支持 的 所 有 不 同 的 设备 提供 了 相同 的 硬件 接 
口 。 例 如 ， 一 个 程序 可 以 从 键盘 读 取 按 键 ， 而 无 须 考虑 读 键 的 系统 调用 针对 的 是 什么 类 型 的 
键盘 。 无 论 是 不 同 键盘 上 不 同位 置 的 按键 ， 还 是 不 同 编码 方式 的 按键 ， 相 关 翻 译 转换 工作 均 
由 操作 系统 负责 处 理 完成 。 

为 避免 因 使 用 不 同 键盘 、 不 同 视频 监视 器 、 不 同 磁盘 等 就 需要 采用 不 同 版 本 的 操作 系统 
可 能 带 来 的 复杂 性 和 成 本 爆 涨 ， 操 作 系统 被 划分 为 适应 不 同 硬件 设备 的 设备 相关 部 分 (包括 
基本 输入 /输出 系统 和 设备 驱动 程序 ) 以 及 面向 所 有 硬件 保持 相同 的 公共 部 分 ( 见 图 1-5 的 
内 核 )。 这 种 将 复杂 工作 分 成 若干 层 或 层级 的 技术 ,是 广泛 应 用 于 包括 操作 系统 在 内 的 大 型 
复杂 软件 系统 的 成 熟 的 软件 技术 。 这 样 ， 维 护 操作 系统 适应 新 的 兼容 性 计算 机 系统 及 不 同 设 
备 ， 就 主要 涉及 基本 输入 /输出 系统 和 设备 驱动 程序 的 修改 (或 重 写 )， 而 其 余 内 核 模块 、 程 
序 和 实用 例 程 均 可 以 保持 基本 不 变 。 这 对 任何 人 来 讲 ， 无 论 用 户 、 制 造 商 还 是 操作 系统 开发 
人 员 ， 都 是 一 个 非常 有 吸引 力 的 想法 。 

如 果 一 家 计算 机 外 围 设 备 制造 商 〈 例 如 ,视频 卡 制造 商 ) 设计 了 一 款 新 的 设备 ， 并 希望 
把 它 卖 给 用 户 ， 这 样 他 们 就 可 以 把 计算 机 升级 到 新 的 硬件 设计 方案 上 来 。 这 时 ， 新 的 问题 又 





图 1-5 个 人 计算 机 (小 型 系统 ) 的 操作 系统 模型 
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出 现 了 。 因 为 ， 现 有 计算 机 中 的 基本 输入 /输出 系统 通常 是 安装 在 只 读 存 储 器 (Read Only 
Memory，ROM) 中 的 ， 所 以 相关 更 换 工 作 非 常 困 难 且 成 本 昂贵 。 解 决 这 个 问题 的 方法 是 ， 
在 操作 系统 被 加 载 到 内 存 时 ， 人 允许 设备 驱动 程序 动态 加 载 和 创建 一 个 可 修改 的 基本 输入 / 输 
出 系统 。 系 统 启 动 时 允许 基本 输入 /输出 系统 的 代码 发 生 替 换 ， 将 可 以 方便 支持 计算 机 添加 
新 的 功能 ,或 者 用 新 软件 替代 基本 输入 /输出 系统 的 现 有 功能 ， 或 者 支持 在 现 有 硬件 上 扩展 
新 的 功能 。 


1.5 ”操作 系统 发 展 导论 


在 本 章 即 将 结束 之 际 ， 我 们 先 从 历史 的 视角 出 发 来 简单 回顾 一 下 操作 系统 是 如 何 发 展 
起 来 的 ， 然 后 讨论 关于 操作 系统 应 当 包 括 的 功能 类 型 的 不 同 看 法 。 关 于 操作 系统 发 展 的 更 详 
细 的 历史 时 间 表 ,我 们 将 在 介绍 过 一 些 其 他 概念 的 基础 上 ， 于 第 3 章 结束 时 展开 进一步 的 
说 明 。 


1.5.1 操作 系统 的 起 源 


当然 ， 在 个 人 计算 机 出 现 之 前 ， 曾 经 有 过 许多 较 大 型 的 计算 机 。 最 初 ， 这 些 机 器 是 非常 
庞大 、 非 常 昂贵 的 。 然 而 按照 现代 的 标准 来 看 ， 它 们 却 是 非常 落后 和 原始 的 ， 而 且 几 乎 没有 
什么 程序 设计 人 员 。 由 于 主 存 容量 非常 小 、 中 央 处 理 器 (Central Processing Unit，CPU) 运 
算 速 度 非常 慢 且 只 有 一 些 简 单 的 输入 /输出 设备 ， 所 以 程序 在 处 理 能 力 方面 受到 极 大 的 制约 
和 限制 。 一 台 典 型 的 早期 计算 机 系统 可 能 拥有 仅仅 几 千 字 S 大 小 的 主 存 、 每 秒 执行 数 千 条 指 
令 的 处 理 器 以 及 用 作 输 入 /输出 设备 的 一 部 电 传 打字 机 但 。 鉴 于 这 些 早期 计算 机 的 处 理 能 力 
非常 有 限 ， 所 以 那些 大 部 分 用 计算 机 基本 机 器 代码 、 机 器 语言 或 汇编 语言 编写 的 程序 必须 要 
经 过 仔细 思量 和 精 雕 细 琢 。 

这 些 程序 非常 了 不 起 ! 短 短 几 百 或 几 千 条 机 器 指令 ， 却 完成 了 让 人 吃惊 的 大 量 的 工作 。 
不 过 ,它们 都 面临 着 一 些 相似 的 需求 : 程序 如 何 打印 输出 结果 ? 程序 如 何 加 载 到 内 存 并 开始 
执行 ? 这 些 需求 ， 即 需要 加 载 程序 到 内 存 、 运 行程 序 以 及 接收 输入 和 生成 输出 ， 就 成 为 构建 
早期 的 操作 系统 的 动力 。 起 初 ， 工 作 在 系统 上 的 为 数 不 多 的 几 个 程序 员 彼 此 认识 ， 和 常常 相互 
分 享 已 经 调试 过 的 例 程 (程序 代码 ) 以 简化 编程 任务 。 这 些 被 共享 的 例 程 〈 璧 如 ,“ 打 印 电 传 
打字 机 上 寄存 器 A 的 取 值 ”) 最 终 被 合并 和 形成 一 个 库 (library)， 该 库 可 以 与 应 用 程序 合并 
(链接 ) 到 一 起 ， 从 而 构成 一 个 完整 的 可 执行 的 程序 。 

这 些 早期 的 计算 机 是 单 用 户 系 统 (single-user system)， 也 就 是 说 ， 任 何 时 候 都 只 能 有 一 
个 用 户 和 一 个 程序 在 运行 。 通 常 ， 程 序 员 会 按 较 小 的 时 间 段 (或许 是 按 10 一 1Smin 的 时 间 段 
递增 处 理 ) 来 预订 对 计算 机 的 使 用 。 程 序 员 将 使 用 这 段 时 间 来 运行 或 调试 一 个 程序 。 由 于 计 
算 机 非常 昂贵 ， 而 计算 机 的 时 间 又 非常 宝贵 ， 所 以 大 块 可 用 的 时 间 段 往往 只 出 现在 夜间 或 清 
晨 。 那 个 时 候 ，, 万 知 俱 静 ， 周 围 几乎 没有 什么 管理 人 员 ， 程 序 员 可 以 比 在 白天 做 更 多 的 事 
情 。 这 一 始 于 计算 早期 的 传统 ， 成 为 一 直 持 续 到 今天 的 少数 几 项 传统 之 一 ! 

程序 一 旦 编写 完成 和 经 过 汇编 处 理 ， 进 而 与 输入 、 输 出 、 数 学 函数 8 、 打 印 结果 格式 化 


日 一 个 字 通 常 为 6 字符 ， 但 不 同系 统 会 有 区 别 。 

日 ” 电 传 打字 机 由 机 电 式 打印 机 和 用 于 收发 报 文 的 键盘 组 成 ， 能 以 每 秒 十 几 个 字符 的 速度 打印 输出 或 打字 输入 。 

四 早期 的 计算 机 硬件 通常 没有 复杂 的 数学 甚至 算术 操作 (譬如 长 除法 ) 的 指令 ， 所 以 这 些 操作 均 以 软件 实用 
例 程 的 方式 来 实现 。 
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处 理 以 及 其 他 常见 任务 等 实用 例 程 链接 或 绑 定 到 一 起 ， 形 成 一 个 可 执行 程序 ， 就 可 以 加 载 到 
内 存 中 并 启动 运行 。 该 程序 可 以 存储 在 穿孔 的 纸 带 上 或 穿孔 卡片 上 。 计 算 机 硬件 将 知道 如 何 
从 输入 设备 开始 读 取 ， 但 它 只 加 载 第 一 张 卡片 或 纸 带 的 第 一 块 区 域 。 因 此 ， 那 里 必须 要 包括 
一 个 小 的 例 程 ， 以 用 于 把 应 用 程序 的 其 余部 分 加 载 到 内 存 中 。 这 个 简短 的 例 程 被 称 为 装 入 程 
序 (loader) 或 称 为 加 载 程序 。 装 人 程序 将 依次 读 取 程 序 员 的 可 执行 程序 ， 并 把 它 和 所 需 的 
实用 例 程 存储 在 内 存 中 一 个 指定 的 位 置 ， 通 常 是 第 一 个 内 存 地址 或 某 个 特殊 的 固定 位 置 。 然 
后 它 将 通过 一 个 分 支 或 “ 子 程序 ”调用 来 转向 执行 由 它 所 加 载 的 程序 。 被 加 载 的 程序 纸 带 或 
卡片 琶 的 样子 如 图 1-6 所 示 9S。 结 束 ( END) 定 界 符 用 于 提示 装 入 程序 ， 已 无 其 他 例 程 需要 
加 载 ， 因 为 例 程 之 后 可 能 会 紧 跟 有 数据 记录 。 





图 1-6 带 有 装 入 程序 和 类 似 于 操作 系统 的 实用 例 程 的 应 用 程序 


时 间 一 长 ， 程 序 员 开 发 出 越 来 越 多 的 实用 例 程 ， 装 人 程序 也 因而 变 得 更 加 复杂 。 装 入 程 
序 很 快 能 够 加 载 由 更 高 级 别 编程 语言 翻译 (编译 ) 得 到 的 程序 。 伴 随 装 和 程序 、 实 用例 程 及 
用 户 程序 的 大 小 的 增长 ， 卡 片 琶 或 纸 带 变 得 越 来 越 大 (为 此 ,诸如 卡片 靶 掉 失 、 纸 带 撕 裂 等 
不 幸 事件 也 变 得 司空 见 惯 )。 这 些 装 入 程序 和 实用 例 程 成 为 早期 操作 系统 的 开端 ， 并 通常 被 
称 为 监控 程序 (monitor)。 


1.5.2 ”操作 系统 应 当做 什么 

从 计算 的 早期 一 直到 今天 ， 一 场 关于 “操作 系统 应 当做 什么 ? ”的 激烈 辩论 一 一 从 斯 文 
的 讨论 到 政治 式 或 几乎 宗教 式 的 争论 一 一 就 从 来 没有 停息 过 。 这 场 辩论 的 两 种 极端 观点 可 以 
被 称 作 最 大 化 观点 和 最 小 化 观点 。 最 大 化 观点 认为 操作 系统 应 当 宫 括 尽 可 能 多 的 功能 ， 而 最 
小 化 观点 则 认为 只 有 最 基本 的 功能 才 应 当 作为 操作 系统 的 组 成 部 分 。 从 早期 的 系统 起 ， 就 已 
开始 提出 这 样 的 问题 :“ 所 有 关于 输入 /输出 的 例 程 都 应 当 包含 在 我 的 程序 中 吗 ? 我 甚至 都 
不 从 读 卡 器 读 东西 呀 ”包含 太 多 的 例 程 一 一 任何 不 必要 的 例 程 一 一 让 程序 的 可 利用 内 存 空 
间 变 得 越 来 越 小 ， 甚 至 由 于 太 小 而 无 法 启动 运行 。 如 何 才能 得 到 刚好 需要 的 东西 呢 ? 诸如 执 
行 浮 点 运算 的 数学 例 程 可 以 在 操作 系统 中 只 包含 一 次 ， 而 不 用 单独 包含 在 每 个 用 户 的 程序 
中 。 但 是 ， 这 样 一 来 ， 每 个 程序 都 必须 承受 由 操作 系统 中 包含 这 些 例 程 占用 内 存 所 带 来 的 额 
外 开销 ， 即 便 是 对 于 没有 使 用 浮 点 运算 的 那些 程序 (如 会 计 应 用 程序 ) 也 是 如 此 。 

直到 最 近 ， 关 于 “什么 应 当 包含 在 操作 系统 中 ?” 的 辩论 仍 在 继续 。 例 如 ， 现 在 普遍 认 
为 ， 用 户 友好 的 操作 系统 接口 应 当 包括 指针 式 设备 (如 鼠标 、 轨 迹 球 或 触 控 板 ) 及 某 种 类 型 
的 带 有 下 拉 式 菜单 的 屏幕 窗口 。 所 以 ， 此 类 接口 是 应 当 作为 操作 系统 的 一 部 分 (故而 赋予 所 
有 的 应 用 程序 类 似 的 “外 观 和 感觉 ” )， 还 是 作为 外 壳 程 序 的 一 部 分 〈 以 方便 让 每 个 用 户 自 己 
决定 他 们 想 要 的 特定 的 外 观 )， 就 成 为 当前 关于 “操作 系统 应 该 包括 什么 ”的 辩论 议题 之 一 。 

公平 地 说 ， 就 像 许多 热 议 的 话题 一 样 ， 最 大 化 观点 和 最 小 化 观点 都 有 自己 的 道理 。 就 目 
前 来 看 ， 历 史 发 展 的 趋势 尚 不 明朗。 对 于 较 新 的 操作 系统 而 言 ， 在 某 些 情况 下 已 变 得 更 小 、 


日 ”这 种 类 型 的 装 入 程序 通常 被 称 为 引导 装 入 程序 (bootstrap loader)。 
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更 简单 且 可 配置 程度 更 高 ， 而 另外 一 些 情况 下 则 恰恰 相反 ， 操 作 系统 变 得 更 大 、 功 能 更 强 、 
制约 更 多 。 关 于 “什么 功能 应 当 安 排 在 什么 地 方 〈 操 作 系统 内 核 还 是 其 他 位 置 ) ?” 的 问题 
导致 了 各 种 不 同 的 操作 系统 设计 的 可 能 性 ， 对 此 我 们 将 在 第 2 章 展 开 进 一 步 的 讨论 。 


1.6” 小结 


本 章 中 ,我 们 首先 介绍 了 操作 系统 的 一 些 基 本 功能 。 我 们 给 出 了 几 个 简单 的 例子 ， 具 
体 说 明了 为 什么 操作 系统 那么 重要 。 然 后 ， 我 们 从 观察 操作 系统 的 两 个 角度 〈 即 用 户 视图 和 
系统 视图 ) 出 发 ， 围 绕 “ 操 作 系统 做 什么 ? ”的 问题 ， 讨 论 了 各 种 不 同 的 观点 。 在 此 基础 上 ， 
我 们 提出 了 一 些 基 本 的 术语 和 概念 ， 并 通过 一 些 图 示 阐 明了 简单 操作 系统 的 典型 模块 组 成 。 
接 下 来 我们 介绍 了 实际 构建 操作 系统 常用 的 几 种 体系 结构 ， 并 讨论 对 于 操作 系统 成 功 设计 
特别 重要 的 “抽象 ”概念 所 特有 的 思想 和 理念 。 最 后 ,我 们 从 历史 角度 出 发 ,简短 回顾 了 操 
作 系统 的 起 源 。 

下 一 章 将 概括 介绍 操作 系统 的 主要 模块 ， 并 进一步 详细 讨论 系统 结构 的 选择 。 


习题 

1.1 用 一 句 话 来 给 出 操作 系统 的 定义 。 

1.2 ”既然 我 们 中 的 绝 大 多 数 人 将 来 都 不 从 事 操作 系统 的 编码 ， 为 什么 我 们 还 需要 学 习 操作 系统 的 相关 
知识 呢 ? 

1.3 ”为 什么 如 手持 式 电子 游戏 机 这 样 的 简单 设备 都 可 能 包含 有 操作 系统 ? 请 给 出 3 个 理由 。 

1.4 操作 系统 的 用 户 视图 与 系统 视图 的 主要 区 别 是 什么 ? 

1.5 教材 就 哪 4 种 不 同类 型 的 用 户 进行 了 讨论 ? 他 们 大 都 对 操作 系统 的 什么 方面 感 兴趣 呢 ? 

1.6 本章 从 系统 视图 出 发 ， 讨 论 了 不 同 用 户 是 如 何 被 支持 的 。 其 间 ， 列举 了 关于 鼠标 移动 和 文件 系统 
两 个 例子 。 考 虑 操作 系统 的 另外 一 个 方面 ， 讨 论 系统 视图 是 如 何 支 持 3 种 不 同类 型 的 用 户 的 。 

1.7 操作 系统 是 应 当 被 专利 化 ， 从 而 使 制造 商 可 以 赚 取 足够 利润 来 继续 他 们 的 开发 ， 还 是 应 当 把 操作 
系统 的 核心 部 分 和 规范 说 明 开 放 给 所 有 用 户 ， 让 大 家 都 知道 ? @ 

1.8 ”就 操作 系统 的 学 习 而 言 ， 控 制 器 如 何 来 定义 最 好 ? 

1.9 抽象 的 总 原则 是 什么 ? 

1.10 ”为 什么 我 们 要 对 操作 系统 进行 抽象 ? 有 些 什么 理由 呢 ? 

1.11 如 何 区 分 操作 系统 和 内 核 ? 

1.12 ”简明 扼要 阐述 早期 大 型 主机 系统 上 操作 系统 的 起 源 。 

1.13 ”窗口 界面 特征 ( 即 决定 外 观 和 感觉 的 相关 因素 ) 是 应 当 作 为 操作 系统 内 核 的 一 部 分 ， 还 是 作为 命 
令 式 外 壳 程 序 的 一 部 分 ? 


日 “任课 教师 请 注意 : 不 要 把 这 个 问题 作为 课堂 教学 内 容 的 一 部 分 ， 除 非 那天 你 没有 别 的 什么 可 以 谈论 。 


17 
。 
18 


第 2 章 | 


Operating Systems: A Spiral Approach 


操作 系统 概念 、 模 块 和 体系 结构 





在 这 一 章 中 ， 我 们 讨论 操作 系统 总 体 上 所 做 的 工作 ， 并 概要 说 明 操作 系统 的 概念 和 组 成 
模块 ， 从 而 使 学 生 对 操作 系统 有 一 些 整体 的 认识 。 我 们 还 讨论 了 一 些 在 几乎 所 有 的 操作 系统 
中 都 会 用 到 的 常见 技术 。 

为 了 能 够 了 解 操 作 系统 是 如 何 参与 到 几乎 所 有 的 系统 操作 中 的 ， 我 们 在 第 2.1 节 一 开始 
就 给 出 一 个 简单 的 用 户 场景 ， 并 描述 了 该 场景 中 由 操作 系统 所 采取 的 一 些 行动 。 在 第 2.2 节 
中 ， 我 们 概述 操作 系统 所 管理 的 系统 资源 主要 类 型 。 这 些 资 源 包 括 处 理 器 、 主 存 、 输 入 /输出 
设备 和 文件 。 然 后 ， 我 们 就 主要 的 操作 系统 模块 及 每 个 模块 所 提供 的 服务 进行 了 概括 性 说 
明 。 相 关 模 块 包括 进程 管理 和 处 理 器 调度 模块 、 内 存 管理 模块 、 文 件 系统 模块 、 输 入 /输出 
管理 和 磁盘 调度 模块 。 在 任何 特定 的 操作 系统 中 ， 它 们 可 能 会 被 实现 为 独立 的 模块 ， 但 也 可 
能 不 会 ， 不 过 这 里 把 它们 独立 看 待 将 有 助 于 更 方便 地 解释 操作 系统 的 相关 概念 。 

接 下 来 ， 在 第 2.3 节 中 ， 我 们 定义 进程 的 概念 (要 知道 ， 进 程 是 操作 系统 所 有 工作 的 核 
心 所 在 )， 并 描述 了 进程 的 状态 以 及 由 操作 系统 所 维护 的 关于 每 个 进程 的 一 些 信息 。 一 个 进 
程 (有 时 称 为 作业 或 任务 ) 9 基本 上 就 是 一 个 正在 执行 的 程序 ， 而 操作 系统 则 代表 所 有 的 进 
程 统一 管理 相关 的 系统 资源 。 在 第 2.4 节 中 ， 我 们 讨论 不 同类 型 的 操作 系统 的 特点 ， 从 一 次 
能 够 运行 或 执行 一 个 单个 进程 的 系统 ， 到 管理 并 发 执行 的 进程 的 系统 ， 再 到 分 时 和 分 布 式 
系统 。 

在 第 2.5 节 中 ,我们 介绍 构建 操作 系统 所 采取 的 一 些 不 同 的 体系 结构 及 方法 ， 具 体 包括 
整体 式 操作 系统 结构 、 微 内 核 结构 和 分 层 式 结构 。 然 后 在 第 2.6 节 中 ， 我 们 描述 一 些 被 各 种 
操作 系统 模块 经 常用 到 的 实现 技术 。 其 中 包括 由 多 任务 操作 系统 维护 的 队列 ， 后 者 用 于 记录 
那些 等 待 获取 资源 或 等 待 特定 服务 执行 完成 的 人 作业。 例如， 进程 可 能 等 待 磁盘 输入 /输出 、 
处 理 器 时 间或 打印 服务 。 我 们 还 描述 了 中 断 和 如 何 处 理 它们 的 一 些 细节 、 面 向 对 象 的 操作 系 
统 设计 以 及 虚拟 机 。 第 2.7 节 围 绕 “什么 功能 应 当 包括 在 操作 系统 里 ?” 议 题 展开 一 场 哲学 
式 的 讨论 。 最 后 ， 在 第 2.8 节 中 ,我 们 对 这 一 章 的 内 容 进 行 总 结 。 


2.1 操作 系统 做 什么 工作 


在 这 一 节 中 ， 我 们 将 通过 一 个 小 例子 及 相应 的 场景 分 析 来 具体 说 明 操 作 系 统 是 如 何 参与 
到 计算 的 几乎 所 有 方面 的 。 请 设想 和 考虑 如 下 简单 的 用 户 场景 : 

某 用 户 想 输入 一 段 不 长 的 留言 用 于 提醒 自己 8。 事 情 的 起 因 是 这 样 的 : 今天 早上 他 开始 
工作 时 ， 听 到 了 一 则 电台 广告 宣称 他 最 喜欢 的 音乐 组 合 即 将 莅临 他 所 在 的 小 镇 进行 演出 ， 于 
是 ， 他 想 提醒 自己 购买 门票 和 邀请 一 些 朋 友 。 为 此 ， 他 开启 了 一 个 日 程 管理 程序 (或 可 能 是 
文本 编辑 器 或 字 处 理 程序 )， 输 入 自己 的 提醒 内 容 ， 保 存 文档 ， 然 后 退出 。 该 用 户 可 能 使 用 


日 术语 作业 和 任务 在 某 些 文献 中 用 于 指 相同 的 概念 ， 但 在 另外 一 些 文献 中 则 用 于 指 不 同 的 概念 。 今 后 遇 到 
此 类 情况 ， 如 有 需要 ， 我 们 将 会 以 脚注 方式 加 以 讨论 和 说 明 。 
日 ”为 简化 叙述 语法 及 统一 相关 代词 ， 本 文 将 假设 该 用 户 是 一 个 男性 。 
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了 掌上 电脑 、 基 于 窗口 的 系统 (例如 ，Mac、 微 软 Windows 或 Linux 操作 系统 及 基于 图 形 化 
用 户 界面 的 文本 编辑 器 )， 或 者 是 一 个 简单 的 基于 文本 的 命令 式 外 壳 程 序 (如 UNIX)。 在 此 ， 
让 我 们 假设 他 正在 使 用 一 个 基于 图 形 化 用 户 界面 的 文本 编辑 器 来 写 一 段 独立 的 提示 信息 ， 并 
将 其 保存 为 一 个 文件 。 为 完成 这 样 的 工作 任务 ， 不 论 使 用 的 是 什么 类 型 的 系统 ， 相 关 场 景 下 
均 会 引发 操作 系统 去 创建 、 管 理 乃 至 最 终 终止 对 应 的 软件 模块 。 当 这 个 用 户 启 动 编 辑 器 或 其 
他 某 个 程序 时 ， 他 便 创建 了 一 个 进程 (也 称 为 任务 或 作业 ) S。 一 个 进程 基本 上 就 是 一 个 执 
行 (execution) 中 的 程序 。 一 个 进程 可 能 正 等 待 着 要 运行 、 正 在 运行 、 正 等 待 着 发 生 某 件 事 
情 或 者 完成 。 进 程 可 能 等 待 的 一 些 事件 包括 来 自用 户 的 按键 操作 、 源 自 磁 盘 驱动 器 的 数据 读 
取 操 作 或 者 读 取 另 外 一 个 程序 所 提供 的 数据 的 操作 。 

在 一 个 进程 能 够 启动 运行 之 前 ， 必 须 首先 把 要 运行 的 可 执行 程序 文件 (二进制 类 型 ) 加 
载 到 主 存 中 。 该 文件 通常 是 从 磁盘 或 某 种 电子 存储 器 (如 闪存 驱动 器 ) 加 载 进 内 存 的 。 期 间 ， 
操作 系统 需要 参与 实施 若干 主要 的 活动 以 完成 相关 工作 任务 。 首 先 ， 需 要 有 一 部 分 主 存 来 存 
放 程 序 的 可 执行 代码 。 同 时 ， 程 序 的 数据 、 变 量 和 临时 存储 机 制 〈 译 者 注 : 堆 或 栈 ) 都 需要 
额外 的 内 存 。 在 我 们 的 示例 中 ， 数 据 将 是 用 户 在 备忘录 文件 中 创建 的 条 目 。 这 些 分 配 内 存 的 
活动 是 操作 系统 必须 要 做 的 内 存 管理 的 一 部 分 。 通 常 ， 可 能 有 若干 程序 同时 存放 在 内 存 中 。 
操作 系统 内 存 管理 器 模块 负责 控制 哪些 进程 被 放置 在 内 存 中 ， 放 置 在 什么 位 置 ， 以 及 每 个 进 
程 分 配 得 到 多 大 的 内 存 空间 。 进 程 管理 ( process management) 则 是 操作 系统 的 另 一 个 关键 
管理 活动 ， 其 决定 哪 一 个 进程 开始 运行 、 运 行 多 长 时 间 以 及 (有 些 情 况 下 ) 运行 在 什么 优先 
级 (或 重要 性 级 别 ) 上 ， 并 通常 由 操作 系统 的 处 理 器 调度 程序 部 分 负责 处 理 。 

一 旦 编辑 器 进程 处 于 运行 状态 ， 它 便 需 要 接受 一 些 按 键 操作 并 把 输入 的 内 容 显 示 在 屏 
幕 上 。 即 使 设备 是 没有 键盘 的 掌上 电脑 ， 字 符 也 会 以 某 种 方式 在 操作 系统 控制 下 被 输入 和 接 
受 。 获 取 按 键 和 字符 ， 并 在 屏幕 上 显示 那些 字符 ， 相 关 工 作 是 通过 操作 系统 的 输入 /输出 和 
设备 管理 模块 经 由 一 系列 步骤 具体 完成 的 。 

当 我 们 的 用 户 点 击 一 个 按键 时 ， 他 便 输 入 了 一 个 必定 会 被 系统 读 取 的 字符 。 事 实 上 ， 这 
个 设备 一 一 当前 情况 下 ， 其 实 就 是 一 个 键盘 一 一 输入 的 是 关于 原始 的 按键 操作 的 信息 。 相 关 
信息 一 一 对 应 按键 在 键盘 上 的 位 置 ( 行 号 和 列 号 ) 以 及 是 否 被 按 下 或 释放 一 一 存储 在 一 个 临 
时 绥 冲 区 中 。 在 掌上 电脑 或 个 人 计算 机 中 ， 可 能 会 有 一 块 特殊 的 键盘 控制 器 芯片 用 于 存放 按 
键 操作 信息 ， 并 负责 向 处 理 器 发 送 中 断 信号 。 除 了 在 键盘 上 的 控制 器 芯片 外 ， 处 理 器 也 可 能 
拥有 自己 的 键盘 设备 控制 器 。 中 断 会 导致 处 理 器 停止 其 当前 正 运行 的 进程 。 如 果 处 理 器 正 进 
行 的 是 较 低 优先 级 别 的 工作 ， 可 能 会 立即 这 么 做 。 但 如 果 处 理 器 已 经 开始 和 正在 进行 的 是 较 
高 优先 级 别 的 工作 ， 则 可 能 随后 再 做 。 接 下 来 ， 操 作 系 统 会 启动 一 个 中 断 服务 例 程 来 处 理 
键盘 操作 。 该 中 断 服务 例 程 是 操作 系统 中 中 断 处 理 和 设备 控制 的 组 成 部 分 。 对 于 每 个 字符 
的 输入 ， 均 会 重复 以 上 处 理 过 程 。 相 关 字 符 被 发 送 给 编辑 器 进程 ， 并 在 屏幕 上 显示 出 来 ， 
则 是 经 由 操作 系统 的 另 一 项 活动 。 就 当前 这 种 情况 而 言 ， 执 行 的 是 对 视频 监视 器 的 输出 
操作 。 

当 我 们 的 用 户 完 成 留言 输入 操作 后 ， 他 将 他 的 留言 保存 为 一 个 文件 。 这 可 能 会 涉及 移 
动 一 个 指针 式 设 备 (如 鼠标 ) 以 指向 屏幕 上 的 文件 菜单 。 鼠 标的 移动 和 点 击 首先 是 由 一 个 设 
备 控制 器 处 理 的 ， 后 者 跟踪 鼠标 的 坐标 并 将 它们 发 送 给 操作 系统 。 用 于 跟踪 鼠标 的 图 标 〈 例 


日 “启动 程序 有 时 也 被 称 为 实例 化 、 执 行 、 加 载 或 运行 程序 。 
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如 ， 箭 头 ) 必须 同步 移动 ， 并 在 监视 器 显示 屏 上 显示 出 来 ， 这 是 另外 一 个 到 屏幕 上 的 输出 操 
作 。 当 鼠标 键 按 下 时 ， 对 应 控制 器 将 相关 信息 发 送 给 操作 系统 ， 后 者 把 鼠标 键 按 下 时 的 坐 
标 信息 进一步 发 送 给 管理 用 户 界面 的 窗口 系统 。 窗 口 系统 拥有 关于 “哪个 窗口 是 当前 活路 
窗口 ?” 以 及 该 窗口 中 各 类 按钮 和 其 他 图 标的 位 置 的 信息 。 利 用 这 些 信 息 ， 窗 口 系统 将 会 把 
当 用 户 按 下 鼠标 键 时 的 光标 的 坐标 ， 匹 配 到 被 “点 击 ” 的 特定 屏幕 按钮 图 标 (或 符号 ) 上 。 
一 般 来 说 ， 处 理 用 户 交 互 的 窗口 系统 是 相当 复杂 的 。 某 些 人 认为 窗口 系统 是 一 个 系统 程序 
( system program)， 与 操作 系统 相对 独立 。 但 其 他 的 一 些 人 则 认为 ， 它 是 操作 系统 不 可 分 制 
的 一 部 分 (参见 第 2.7 节 关 于 “什么 是 操作 系统 的 组 成 部 分 ? ”的 讨论 )。 

继续 我 们 的 情景 分 析 ， 我 们 的 用 户 可 能 会 选择 一 个 名 为 “个 人 备忘录 ”的 目录 用 于 存放 
他 的 文件 。 这 便 引 发 操作 系统 的 文件 管理 (file management) 模块 的 运作 。 当 用 户 选中 对 应 
目录 (例如 ， 通 过 双击 文件 夹 图 标 ) 时 ， 将 导致 操作 系统 的 文件 管理 器 采取 一 系列 动作 。 首 
先 ， 它 必须 通过 从 操作 系统 的 内 部 表格 中 检索 相关 目录 信息 ， 打 开 对 应 目录 。 这 里 ， 目 录 信 
息 包括 存放 在 该 目录 下 的 文件 (也 可 能 是 其 他 目录 ) 的 名 称 ， 以 及 该 目录 在 磁盘 上 存储 的 位 
置信 息 。 然 后 ， 用 户 必 须 输入 一 个 文件 名 ， 如 “演唱 会 提醒 ”"， 于 是 ,文件 系统 将 检查 核对 
并 确保 该 目录 中 没有 任何 现 有 文件 具有 相同 的 名 称 。 进 而 ,磁盘 空间 分 配 模块 被 调用 ， 尝 试 
在 磁盘 上 找到 一 块 合适 的 空闲 空间 区 域 来 存储 文件 。 最 后 ， 操 作 系 统 文件 管理 器 将 在 该 目录 
中 创建 一 个 文件 目录 项 ， 用 以 包含 新 文件 的 各 种 信息 ， 如 文件 名 、 文 件 类 型 和 其 在 磁盘 的 存 
放 位 置 等 。 

正如 我 们 从 这 个 非常 简单 的 例子 中 可 以 看 到 的 那样 ， 操 作 系统 参与 到 了 用 户 和 程序 交互 
的 几乎 每 一 个 方面 一 一 从 低级 别 的 活动 (如 处 理 键 盘 按键 和 鼠标 移动 操作 )， 到 资源 分 配 算 
法 (如 分 配 内 存 空间 和 处 理 器 时 间 )， 再 到 更 高 级 别 的 活动 (如 管理 文件 名 和 目录 )。 关 于 操 
作 系 统 如 何 处 理 所 有 这 些 不 同 任务 的 描述 和 介绍 ， 将 贯穿 本 书 的 始末 。 


2.2 ”操作 系统 管理 的 资源 及 主要 的 操作 系统 模块 


操作 系统 的 一 项 主要 作用 就 是 对 系统 资源 进行 管理 。 为 此 ， 本 节 介 绍 操作 系统 管理 的 主 
要 资源 类 型 。 然 后 ， 通 过 阐明 主要 的 操作 系统 模块 、 每 个 模块 所 管理 的 资源 以 及 每 个 模块 所 
提供 的 服务 和 功能 ， 完 整地 刻画 出 一 个 典型 的 操作 系统 的 概念 视图 。 


2.2.1 操作 系统 管理 的 资源 类 型 


本 小 节 首先 介绍 典型 操作 系统 所 管理 的 主要 资源 。 这 些 资 源 包 括 最 底层 的 处 理 侣 、 主 
存 、 高 速 缓存 、 辅 助 存 储 器 和 输入 /输出 设备 ， 以 及 较 高 层级 的 文件 系统 和 用 户 界面 。 男 
外 ， 操 作 系 统 还 对 网 络 访问 进行 管理 ， 并 对 其 所 管理 的 各 种 资源 提供 安全 机 制 来 实施 保护 。 

处 理 器 

操作 系统 需要 随时 调度 和 确立 每 一 个 处 理 器 上 运行 哪 一 个 进程 。 在 较 早 的 单 进程 系统 
中 ， 这 非常 简单 ， 因 为 整个 内 存 空 间 仅 有 一 道 进 程 驻 留 其 中 ， 操 作 系统 主要 负责 把 处 理 器 的 
控制 权 交 给 驻 留 内 存 的 那 道 进程 ， 从 而 使 其 启动 执行 即 可 。 然 而 ， 即 使 在 这 样 一 个 简单 的 系 
统 中 ， 在 让 进程 控制 处 理 器 之 前 ， 操 作 系 统 也 必须 完成 一 些 其 他 的 事项 ， 例 如 ， 设 置 内 存 保 
护 寄存 器 和 切换 到 用 户 执行 模式 等 。 

在 多 任务 系统 中 ， 处 理 器 资源 的 管理 是 相当 复杂 的 ， 因 为 可 能 同时 有 多 个 进程 驻 留 在 内 
存 空 间 。 如 果 系 统 中 包含 有 多 个 处 理 器 ， 则 情况 可 能 会 变 得 更 加 复杂 。 操 作 系统 将 会 维护 各 
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种 各 样 的 进程 队列 。 与 处 理 器 调度 最 相关 联 的 队列 称 为 就 绪 队 列 (ready queue)， 其 中 包含 [22] 
有 已 准备 就 绪 并 可 执行 的 所 有 进程 。 如 果 进 程 拥有 不 同 的 优先 级 ， 则 可 能 需要 为 每 个 优先 级 
别 单 独 设立 一 个 相应 的 就 绪 队 列 。 每 个 进程 通常 会 被 设 定 一 个 控制 处 理 器 的 最 长 时 间 段 ， 称 
为 定量 时 间 (time quantum)， 即 时 间 片 (time slice)。 如 果 该 定量 时 间 已 用 完 ， 即 便 进 程 尚 
未 执行 结束 ， 定 时 器 中 断 也 会 即时 启动 一 个 称 为 上 下 文 切 换 (context switching) 的 操作 系统 
进程 ， 把 处 理 器 控制 权 切 换 给 另 一 个 进程 。 我 们 将 在 第 9 章 中 详细 讨论 处 理 器 调度 算法 以 及 
操作 系统 是 如 何 管理 处 理 器 资源 的 。 

主 存 和 高 速 缓存 

操作 系统 需要 在 进程 可 以 执行 之 前 为 其 分 配 内 存 空间 。 程 序 的 可 执行 代码 通常 存储 在 硬 
盘 (或 其 他 的 辅助 存储 介质 ) 上 。 当 用 户 或 程序 要 执行 一 个 驻 留 在 磁盘 的 程序 时 ， 操 作 系 统 
必须 在 磁盘 上 查找 和 确定 程序 代码 文件 ， 同 时 分 配 足够 的 内 存 空间 来 保存 程序 的 初始 部 分 。 
由 于 许多 程序 都 非常 大 ， 所 以 操作 系统 可 能 从 磁盘 只 加 载 程序 的 一 部 分 到 内 存 。 内 存 管理 的 
主要 功能 之 一 就 是 为 进程 分 配 初 始 的 内 存 空间 ， 并 在 进程 需要 时 再 从 磁盘 加 载 程序 的 其 他 部 
分 到 内 存 。 如 果 所 有 的 内 存 空间 都 已 被 占用 ， 那 么 操作 系统 的 内 存 管 理 模块 必须 把 某 些 驻 留 
内 存 的 信息 对 换 ( swap out) 到 外 存 ， 以 便 其 可 以 加 载 进 程 所 需 的 其 他 部 分 到 内 存 。 我 们 在 
第 10 章 和 第 11 章 讨论 内 存 管理 技术 。 

辅助 存储 器 

操作 系统 管理 的 另外 一 种 重要 的 资源 是 辅助 存储 器 ， 通 常 为 硬盘 。 大 多 数 的 程序 代码 文 
件 和 数据 文件 都 存储 在 硬盘 上 ， 除 非 发 生 需 要 把 它们 加 载 到 内 存 的 请 求 。 每 当 一 个 进程 所 要 
求 的 数据 或 代码 不 在 内 存 时 ， 就 会 有 一 个 请 求 被 发 送 到 操作 系统 的 磁盘 调度 模块 。 操 作 系统 
通常 会 暂停 请 求 者 进程 ， 直 到 所 需 数据 读 和 到 内 存 为 止 。 在 多 任务 系统 中 ， 可 能 有 许多 关于 
磁盘 数据 的 读 取 (加载 到 内 存 ) 或 写 出 (存储 到 磁盘 ) 的 请 求 。 操 作 系 统 往往 会 维护 磁盘 读 
写 请求 的 一 个 或 多 个 队列 ， 并 使 用 各 种 算法 来 优化 相关 请 求 服务 。 我 们 将 在 第 14 章 讨 论 磁 
盘 调 度 (作为 输入 /输出 管理 讨论 的 一 部 分 )。 

输入 / 输出 设备 

操作 系统 还 必须 管理 和 控制 连接 到 计算 机 系统 的 各 种 输入 和 输出 设备 8。 操作 系统 包含 
有 被 称 为 设备 驱动 程序 的 模块 ， 用 于 实现 对 这 些 设备 的 访问 控制 。 因 为 现在 有 许多 不 同类 型 
的 输入 /输出 设备 ， 且 用 户 经 常 给 他 们 的 系统 添加 新 的 输入 /输出 设备 ， 所 以 现代 操作 系统 
能 够 检测 到 新 硬件 并 动态 地 安装 相应 的 设备 驱动 程序 。 设 备 驱 动 程序 处 理 与 设备 控制 器 之 间 
的 低级 别 的 交互 ， 并 为 操作 系统 的 其 余部 分 呈现 一 个 关于 输入 /输出 设备 的 较 高 级 别 的 视 
图 。 这 样 ， 操 作 系 统 就 能 够 以 一 种 抽象 和 统一 的 方式 来 处 理 相似 的 设备 。 我 们 将 在 第 12 章 
中 讨论 输入 /输出 管理 。 [ 23 ] 

文件 系统 

上 述 讨论 的 资源 都 是 硬件 资源 ， 所 以 均 应 归 为 低级 资源 。 操 作 系 统 还 管理 着 通过 软件 创 
建 的 较 高 级 别 的 资源 ， 其 中 ， 一 种 主要 的 此 类 资源 是 文件 系统 。 作 为 操作 系统 的 一 个 模块 ， 
文件 系统 提供 了 一 种 较 高 级 别 的 接口 ， 人 允许 用 户 和 程序 对 各 种 类 型 的 文件 执行 创建 、 删 除 、 
人 和 修改、 打开、 关闭 及 其 他 操作 。 最 简单 的 文件 类 型 就 是 把 文件 内 容 看 作 一 个 字 节 序列 。 当 
然 ， 也 可 以 是 较 复 杂 的 文件 结构 ， 例 如 ， 将 文件 内 容 组 织 成 记录 。 文 件 系统 允许 用 户 对 文件 
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命名 ,将 文件 组 织 到 目录 中 ,保护 文件 ， 并 使 用 各 种 文件 操作 来 访问 这 些 文件 。 我 们 将 在 第 
12 章 对 文件 管理 展开 进一步 的 详细 讨论 。 

用 户 界面 

许多 现代 操作 系统 包含 有 另外 一 个 高 级 模块 来 处 理 与 用 户 之 间 的 交互 。 其 包括 在 计算 机 
屏幕 上 创建 和 管理 窗口 的 功能 ， 从 而 支持 用 户 与 系统 进行 交互 。 通 过 在 操作 系统 中 设立 这 样 
的 一 个 模块 ， 用 户 就 能 够 以 统一 的 方式 来 访问 各 种 各 样 的 资源 。 例 如 ,访问 文件 系统 中 的 目 
录 和 访问 互联 网 上 的 文件 将 通过 一 个 统一 的 接口 来 进行 处 理 9S。 我 们 在 本 书 的 各 个 章节 都 会 
讨论 到 用 户 界面 。 

网 络 访问 

操作 系统 管理 的 另 一 种 资源 是 网 络 访问 ， 相 关 资 源 管理 功能 支持 一 台 计 算 机 上 的 用 户 和 
程序 访问 计算 机 网 络 上 的 其 他 服务 和 设备 。 操 作 系统 既 提供 低级 的 网 络 访问 功能 ， 也 提供 高 
级 的 网 络 访问 功能 。 低 级 功能 的 一 个 例子 是 支持 程序 创建 网 络 端口 ， 并 连接 到 另 一 台 机 器 的 
端口 上 。 高 级 功能 的 一 个 例子 是 支持 访问 远程 文件 。 我 们 将 在 第 15 章 和 第 17 章 讨论 网 络 和 
分 布 式 系统 。 

提供 保护 与 安全 

操作 系统 还 提供 了 保护 各 种 资源 的 机 制 来 防止 未 经 授权 的 访问 ， 同 时 提供 相关 安全 技术 
支持 系统 管理 员 实施 他 们 的 安全 策略 。 最 简单 的 安全 类 型 是 通过 密码 来 实施 访问 授权 ， 但 一 
般 来 说 这 是 不 够 的 。 我 们 将 在 第 16 章 讨论 安全 和 保护 。 


2.2.2 ”操作 系统 的 主要 模块 


图 2-1 在 某 抽象 级 别 上 对 操作 系统 的 一 些 主要 模块 进行 了 说 明 。 毫 不 奇怪 ， 其 中 许多 模 
块 与 其 所 管理 的 资源 几乎 完全 对 应 。 另 有 一 些 模块 提供 了 诸多 其 他 模块 所 使 用 的 通用 支撑 功 
能 。 操 作 系统 模块 既 提供 了 由 系统 用 户 和 程序 所 访问 的 功能 ， 也 提供 了 由 其 他 操作 系统 模块 
L24j 所 访问 的 功能 。 某 些 功 能 仅 限 于 由 其 他 操作 系统 模块 在 特权 模式 下 进行 访问 ， 例 如 ， 设 备 驱 
动 程序 的 功能 往往 仅 限 于 操作 系统 内 部 进行 访问 。 其 他 的 功能 ， 如 文件 系统 功能 ， 则 可 由 操 
作 系 统 模块 、 用 户 或 应 用 程序 所 访问 。 
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图 2-1 主要 的 操作 系统 模块 


在 图 2-1 中 ， 我 们 并 未 标 出 操作 系统 模块 之 间 是 如 何 相互 作用 的 。 这 是 因为 ， 相 互 作用 
的 类 型 取决 于 操作 系统 实现 所 采用 的 特定 的 体系 结构 。 例 如 ， 在 层次 式 体系 结构 (layered 


日 ”就 像 我 们 先前 提 到 的 那样 ， 用 户 界 面 有 时 被 认为 是 系统 程序 的 组 成 部 分 ,而 非 操作 系统 必 不 可 少 的 一 
部 分 。 


和 锚 2 识 操作 和 孙 统 构 念 、 榜 块 和 体系 结 蒋 19 


architecture) 或 称 为 分 层 式 体 系 结构 中 ， 相 关 模 块 将 被 划分 成 若干 层级 。 一 般 而 言 ， 某 个 层 
级 的 模块 可 以 调用 同一 层级 或 较 低 层级 的 模块 所 提供 的 功能 。 另 一 方面 ， 在 面向 对 象 的 体 
系 结构 ( object-oriented architecture) 中 ， 每 个 模块 将 被 实现 为 一 个 或 多 个 提供 服务 的 对 象 ， 
且 任 何 对 象 都 可 以 调用 其 他 对 象 所 提供 的 服务 。 在 整体 式 体系 结构 (monolithic architecture ) 
中 ， 所 有 的 模块 将 被 统一 实现 为 一 个 庞大 的 程序 。 我 们 将 在 后 面 一 节 中 讨论 最 常见 的 几 种 操 
作 系 统 体系 结构 。 


2.3 ”进程 概念 和 操作 系统 进程 信息 


考虑 到 进程 在 操作 系统 概念 中 的 核心 地 位 ， 现 在 我 们 来 介绍 进程 的 概念 。 首 先 ， 我们 将 
定义 进程 是 什么 ， 并 描述 进程 可 能 经 历 的 各 种 状态 以 及 导致 进程 发 生 状 态 转换 的 事件 类 型 。 
接 下 来 ,我们 将 讨论 操作 系统 为 管理 进程 和 资源 而 必须 维护 的 各 种 信息 。 我 们 还 将 介绍 进程 
控制 块 (Process Control Block，PCB) 的 概念 ， 即 操作 系统 用 于 跟踪 每 一 进程 而 维护 的 数据 
结构 。 最 后 ,我 们 将 对 各 种 不 同 的 进程 进行 归纳 和 分 类 。 


2.3.1 进程 定义 和 进程 状态 


一 个 进程 就 是 一 个 正在 运行 的 程序 。 要 想 成 为 一 个 进程 ， 程 序 需 要 由 操作 系统 启动 执 
行 。 不 过 ， 一 个 进程 在 其 存在 的 整个 期 间 并 不 一 定 一 直 在 运行 。 例 如 ， 它 可 能 会 等 待 输入 / 
输出 (譬如 ， 某 个 按键 被 按 下 ) 或 者 等 待 操作 系统 为 其 分 配 某 些 资源 ( 壁 如 ,一 块 内 存 )。 每 
个 进程 都 有 一 个 特定 的 执行 序列 以 及 一 个 用 于 指定 要 执行 的 下 条 指令 位 置 的 程序 计数 器 
( program counter)。 它 也 将 拥有 操作 系统 为 其 分 配 的 各 种 资源 。 例 如 ， 它 将 需要 一 些 内 存 空 
间 (memory space) 来 存储 其 所 有 的 或 部 分 的 程序 代码 和 数据 (如 程序 变量 )。 它 将 几乎 肯定 
会 访问 文件 ， 所 以 它 也 可 能 会 拥有 一 些 相 关联 的 打开 文件 ( open file)。 进 程 有 时 也 被 称 为 作 
业 9 (job) 或 任务 (task)， 我 们 将 交替 使 用 这 些 术 语 。 

一 旦 进程 被 创建 ， 它 就 可 能 处 于 如 下 某 种 状态 : 运行 状态 ( 若 其 拥有 处 理 器 控制 权 )、 
就 绪 状 态 ( 若 所 有 的 处 理 器 都 正 被 其 他 进程 所 使 用 )、 等 待 状态 ( 若 其 需要 等 待 某 个 事件 的 发 
生 )， 等 等 。 一 个 进程 可 能 经 历 的 典型 状态 如 图 2-2 所 示 ， 称 为 状态 转换 图 ( state transition 
diagram)。 图 2-2 中 的 结 点 (呈现 为 六 边 形 ) 表示 进程 状态 (process state)， 而 有 向 边 (directed 
edge， 即 箭头 ) 表示 状态 转换 ( state transition)。 现 在 ,我 们 来 讨论 这 些 状态 以 及 触发 状态 
转换 的 对 应 事件 9。 

0 号 状态 转换 将 创建 一 个 新 的 进程 ， 该 状态 转换 可 能 会 因 如 下 某 种 事件 而 触发 : 

1 ) 一 个 正在 运行 的 操作 系统 进程 可 能 创建 或 克隆 一 个 新 的 进程 。 例 如 ， 当 一 个 交互 式 
用 户 登 录 到 计算 机 系统 中 时 ， 负 责 登 录 的 操作 系统 进程 通常 会 创建 一 个 新 的 进程 来 处 理 与 用 
户 之 间 的 交互 以 及 其 所 输入 的 命令 。 操 作 系 统 也 可 能 会 创建 一 些 新 的 进程 (如 中 断 处 理 器 进 
程 或 错误 处 理 器 进程 ) 来 负责 承担 操作 系统 的 某 些 功能 。 

2 ) 一 个 用 户 进程 也 可 能 通过 调用 操作 系统 中 创建 新 进程 的 函数 来 创建 另 一 个 进程 。 例 
如 ， 网 络 浏览 器 可 能 创建 一 个 新 的 进程 来 运行 外 部 的 “插件 ”模块 ， 从 而 处 理 在 网 站 上 访问 


晶 历史 上 ， 术语 作 业 曾 指 采用 所 谓 作业 控制 语言 ( Job Control Language，JCL) 编写 的 可 以 调用 各 种 任务 的 
控制 序列 ， 相 关 解 释 主要 应 用 于 早期 的 批 处 理 系 统 中 。 

四 ”该 状态 图 较为 典型 和 常见 ， 但 对 于 特定 的 操作 系统 而 言 ， 操 作 系统 设计 者 有 可 能 想 要 分 辩 其 他 的 状态 ， 
于 是 人 们 就 会 在 系统 内 部 或 文档 中 看 到 更 少 状态 或 更 多 状态 的 情况 。 
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到 的 特定 类 型 的 多 媒体 内 容 。 





图 2-2 ”进程 状态 及 转换 的 简化 示意 图 


3 ) 当 某 道 作业 由 操作 系统 以 预定 事件 方式 启动 时 (例如 ， 在 UNIX 系统 上 的 一 道 “cron” 
作业 ， 即 周期 性 或 例 行 性 执行 的 作业 )， 操 作 系 统 将 创建 一 个 进程 来 执行 该 道 作 业 。 

当 一 个 新 的 进程 被 创建 时 ， 其 处 于 新 状态 (new state)。 操 作 系 统 必须 建立 用 于 保存 进 
程 有 关 信 息 的 表格 ( 见 第 2.2.2 节 ), 分 配 必要 的 资源 (如 用 于 存储 程序 的 内 存 )， 查 找 定 位 程 
序 可 执行 文件 和 该 进程 所 需 的 任何 初始 化 数据 ， 并 执行 适当 的 例 程 把 进程 的 初始 化 部 分 加 载 
到 内 存 中 。 图 2-2 中 的 1 号 状态 转换 表示 操作 系统 把 进程 从 新 状态 转换 到 了 就 绪 状 态 (ready 
state)， 后 者 表明 该 进程 已 经 准备 就 绪 并 具备 除 处 理 器 之 外 的 所 有 执行 条 件 。 注 意 在 1 号 状 
态 转换 可 以 发 生 之 前 ， 操 作 系 统 必 须 被 允许 添加 一 个 新 的 进程 。 具 体 而 言 ， 一 些 操作 系统 可 
能 对 特定 时 间 人 允许 进程 的 最 多 数量 进行 了 限定 ， 所 以 如 果 进 程 数 已 经 达到 最 大 值 ， 则 将 不 会 
准许 添加 新 的 进程 。 在 大 型 主机 系统 或 集群 系统 中 ， 还 可 能 存在 作业 执行 之 前 就 必须 拥有 足 
够 可 用 资源 的 要 求 ， 这 可 能 是 一 个 特定 的 输入 /输出 设备 ， 也 可 能 是 一 定数 量 的 处 理 器 。 只 
有 当 所 有 这 些 初 始 化 工作 完成 之 后 ， 进 程 才 会 转移 到 就 绪 状态 。 

即使 一 个 进程 处 于 就 绪 状 态 ， 也 只 有 在 操作 系统 把 处 理 器 控制 权 交 给 它 后 才 会 开始 执 
行 ， 即 图 2-2 中 的 2 号 状态 转换 。 当 前 ， 进 程 正 在 执行 ， 并 处 于 运行 状态 (running state ) 。 
如 果 有 两 个 ( 含 ) 以 上 的 进程 处 于 就 绪 状 态 ， 则 需要 从 中 选择 某 个 进程 加 以 执行 ， 对 应 的 操 
作 系 统 部 件 称 为 处 理 器 调度 程序 ( CPU scheduler) 或 进程 调度 器 (process scheduler)。 我 们 
将 会 在 第 9 章 就 进程 调度 展开 详细 讨论 。 

如 果 一 个 进程 执行 到 结束 或 因 发 生 错 误 或 异常 而 被 操作 系统 中 止 ， 相 应 的 事件 ( 即 一 个 
进程 执行 到 结尾 或 发 生 致 命 错误 ) 将 触发 图 2-2 中 的 6 号 状态 转换 。 这 将 导致 一 个 进程 步 人 
终止 状态 ( terminated state)， 此 时 此 刻 ， 操 作 系 统 将 对 该 进程 实施 清理 操作 ， 例 如 ， 删 除 该 
进程 的 信息 和 数据 结构 ， 释放 进程 所 占用 的 内 存 和 其 他 资源 。 当 相关 清理 工作 完成 时 ， 就 触 


第 2 羡 ”所作 和 承 统 磅 念 、 礁 区 和 和 体 夭 结 攀 。 21 


发 图 2-2 中 的 7 号 状态 转换 ， 从 而 导致 该 进程 退出 系统 。 

当 一 个 进程 处 于 运行 状态 时 ， 可 能 会 发 生 其 他 两 种 状态 转换 ， 即 图 2-2 中 的 3 号 状态 转 
换 和 5 号 状态 转换 。 如 果 该 进程 所 需 的 某 些 资源 不 可 用 ， 或 者 在 其 可 以 继续 处 理 之 前 需要 某 
输入 /输出 操作 发 生 或 完成 (如 等 待 按键 操作 或 从 文件 读 取 数 据 )， 就 会 触发 3 号 状态 转换 。 
这 将 导致 进程 陷入 等 待 状态 ( wait state) 或 阻塞 状态 (blocked state) 。 对 应 进程 将 一 直 处 于 
等 待 状态 ， 直 到 该 进程 所 需 资源 得 到 分 配 或 其 输入 /输出 请 求 已 经 完成 。 这 时 ,将 发 生 4 号 
状态 转换 ， 进 程 从 等 待 状态 返回 到 就 绪 状 态 。 另 一 方面 ， 从 运行 状态 直接 转移 到 就 绪 状 态 的 
5 号 状态 转换 通常 发 生 在 操作 系统 决定 暂停 正在 运行 的 进程 的 时 候 ， 因 为 这 时 系统 有 更 紧要 
的 进程 需要 运行 。 这 可 能 是 由 于 定时 器 ， 也 可 能 是 由 于 因 各 种 情况 而 发 生 的 某 种 其 他 类 型 的 
中 断 。 最 常见 的 理由 是 因 处 理 器 调度 算法 (我 们 将 在 第 8 章 进 行 描述 和 说 明 ) 而 要 把 处 理 器 
分 配给 男 一 个 进程 。 


2.3.2 ”操作 系统 维护 的 进程 信息 


为 了 跟踪 一 个 进程 ， 操 作 系 统 通常 会 为 其 分 配 一 个 唯一 的 进程 标识 符 (process identifier 
或 process ID)。 同 时 ,操作 系统 还 会 创建 一 个 称 为 进程 控制 块 ( Process Control Block, PCB) 
的 数据 结构 来 记录 进程 的 有 关 信 息 ， 包 括 进程 标识 符 、 进 程 正在 使 用 或 请 求 的 资源 、 进 程 优 
先 级 、 进 程 对 各 种 系统 资源 或 文件 的 访问 权限 等 。 进 程控 制 块 还 包括 对 其 他 操作 系统 数据 结 
构 的 引用 信息 ， 相 关 数 据 结构 拥有 如 何 定 位 内 存 空 间 和 (进程 正在 使 用 的 已 经 打开 的 ) 文件 
的 对 应 信息 。 对 于 非 运 行 状态 的 进程 ， 进 程控 制 块 中 还 保存 了 该 进程 的 硬件 处 理 器 状态 的 相 
关 信息 ， 壁 如 程序 计数 寄存 器 和 其 他 处 理 器 寄存 器 的 取 值 ， 因 为 在 进程 重 返 运行 状态 和 重启 
进程 时 将 需要 这 些 信息 。 图 2-3 给 出 了 通常 保存 在 进程 控制 块 中 的 一 些 信 息 。 

进程 正在 使 用 的 已 打开 文件 的 信息 通常 保存 在 一 个 独立 的 操作 系统 数据 结构 中 ， 该 数据 
结构 由 操作 系统 文件 管理 器 模块 ( 见 第 12 章 ) 创建 和 使 用 。 进 程 占用 内 存 区 域 的 相关 信息 
则 通常 保存 在 由 操作 系统 内 存 管 理 模块 ( 见 第 10 章 和 第 11 章 ) 创建 和 使 用 的 页 表 或 界限 寄 
存 器 中 。 所 有 这 些 表格 均 被 进程 控制 块 数据 结构 所 引用 。 其 他 如 进程 优先 级 别 、 进 程 安全 或 
保护 级 别 ( 见 第 16 章 ) 的 引用 等 信息 也 将 包含 在 进程 控制 块 中 。 


2.3.3 ”进程 分 类 和 执行 模式 


可 以 把 进程 划分 为 如 下 几 种 类 型 : 

1 ) 用 户 进 程 或 应 用 进程 。 它 们 是 那些 执行 代 
表 用 户 的 应 用 程序 的 进程 。 对 应 的 例子 包括 运行 处 理 器 状态 ”“ 
会 计 程 序 的 进程 、 运 行 数 据 库 事务 的 进程 以 及 运 发 处 理 器 寄存 器 内 容 、 当 前 指令 位 置 ) 
行 计算 机 游戏 的 进程 。 “用 于 访问 进程 内 存 的 数据 结构 

2 ) 系统 程序 进程 。 这 些 进程 执行 的 是 面向 ”| (通常 为 页 表 或 界限 寄存 器 ) 的 指针 


公共 系统 服务 而 非特 定 终端 用 户 服务 的 应 用 程序 。 











相关 程序 一 般 与 操作 系统 交互 密切 ， 并 需要 关于 


系统 接口 的 特殊 信息 以 及 关于 可 重 定位 程序 模块 
其 他 进程 信息 





或 可 执行 程序 文件 的 布局 的 系统 结构 。 对 应 的 例 
子 包括 程序 设计 语言 编译 器 和 程序 开发 环境 。 其 
他 如 互联 网 浏览 器 、 窗 口 式 用 户 界面 以 及 操作 系统 图 2-3 进程 控制 块 中 由 操作 系统 维护 的 信息 
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外 壳 程 序 等 ， 在 被 一 些 人 认为 是 系统 程序 的 同时 ， 却 被 其 他 人 认为 是 操作 系统 本 身 的 组 成 部 
分 ( 见 第 2.7 节 )。 

3 ) 操作 系统 进程 。 它 们 也 被 称 为 守护 进程 ， 是 执行 操作 系统 服务 和 功能 的 进程 。 对 应 
的 例子 包括 内 存 管 理 、 进 程 调度 、 设 备 控制 、 中 断 处 理 、 文 件 服务 和 网 络 服务 。 

关于 进程 ， 几 乎 所 有 的 处 理 器 都 支持 两 种 执行 模式 : 特权 模式 和 非特 权 模 式 ( 即 常规 模 
式 或 用 户 模式 )。 操 作 系 统 内 核 进程 通常 执行 在 特权 模式 (也 称 为 管 态 、 内 核 模 式 或 监控 模 
式 ) 下 ， 它 们 被 允许 执行 所 有 类 型 的 硬件 操作 ， 并 可 访问 所 有 的 内 存 空间 和 输入 /输出 设备 。 
其 他 进程 则 运行 在 用 户 模式 ( 译 者 注 : 也 称 为 目 态 ) 下 ， 它 们 常 被 禁止 执行 一 些 命令 ， 如 不 
允许 执行 低级 输入 /输出 命令 等 。 用 户 模 式 还 带 来 了 硬件 内 存 保护 机 制 ， 使 一 个 进程 只 能 访 
间 其 受 限 内 存 空间 中 的 内 存 。 这 样 就 可 以 保护 操作 系统 和 其 他 进程 所 使 用 的 内 存 ， 防 止 相关 
内 存 空 间 因 受到 错误 或 恶意 的 访问 而 可 能 导致 数据 或 程序 代码 的 损坏 。 


2.4 面向 功能 的 操作 系统 分 类 


有 许多 不 同类 型 的 操作 系统 。 其 中 ， 有 些 操作 系统 局 限 性 比较 大 ， 仅 提供 有 限 的 服务 
和 功能 ; 而 其 他 的 一 些 操作 系统 则 非常 复杂 ， 提 供 许 多 服务 和 相当 多 的 功能 。 在 这 里 ， 我 们 
将 就 单 用 户 、 多 任务 、 分 时 、 分 布 式 及 实时 系统 5 种 操作 系统 类 型 进行 简明 扼要 的 介绍 和 
说 明 。 


2.4.1 单 用 户 单 任务 操作 系统 


单 用 户 单 任务 操作 系统 ( single-user single-tasking OS) 在 任何 时 间 仅 运行 唯一 的 一 道 进 
程 。 第 一 批 操作 系统 就 属于 这 种 类 型 ， 它 们 是 早期 的 个 人 计算 机 上 的 操作 系统 ， 璧 如 CP/M 
及 早期 版 本 的 微软 DOS 操作 系统 (MS-DOS)。 类 似 的 操作 系统 今天 依然 可 能 会 在 诸如 嵌入 
式 系统 等 资源 有 限 的 系统 中 找到 。 此 类 操作 系统 并 不 像 我 们 下 面 讨论 的 其 他 操作 系统 那么 复 
杂 。 但 是 ， 它 们 仍然 要 处 理 很 多 细节 和 问题 。 它 们 提供 的 主要 服务 是 处 理 输入 /输出 及 启动 
和 终止 程序 。 鉴 于 任何 特定 时 间 仅 有 操作 系统 和 一 道 进程 驻 留 在 内 存 中 ， 所 以 它们 的 内 存 管 
理 相当 简单 ， 而 且 此 类 系统 不 需要 处 理 器 调度 。 按 照 我 们 的 螺旋 式 方法 ,我 们 将 在 第 3 章 中 
描述 由 单 用 户 操作 系统 所 提供 的 基本 服务 和 功能 。 我 们 主要 以 CP/M 为 例 具体 说 明 相 关 概 念 
是 如 何在 一 个 真实 系统 中 实现 的 ， 还 间或 提 到 了 微软 DOS 操作 系统 ， 因 为 它 曾 在 相当 长 的 
一 段 时 间 里 主宰 过 操作 系统 市 场 。 


2.4.2 多 任务 操作 系统 


多 任务 操作 系统 ( multitasking OS) 或 多 道 程 序 设 计 操 作 系 统 ( multiprogramming OS) 
是 下 一 复杂 级 别 即 具有 一 定 复 杂 性 的 操作 系统 。 此 类 操作 系统 对 并 发 执行 的 多 个 进程 进行 控 
制 。 因 此 ， 其 必须 设立 处 理 器 调度 模块 用 于 选择 哪 一 个 就 绪 进 程 即将 运行 。 大 多 数 现代 的 计 
算 机 都 支持 多 任务 。 创 建 多 任务 操作 系统 的 最 初 原因 之 一 是 为 了 提高 处 理 器 的 利用 率 ， 即 在 
系统 执行 输入 /输出 的 同时 保持 处 理 器 处 于 忙碌 状态 。 在 单 任务 系统 中 ， 如 果 唯 一 的 运行 进 
程 提 出 输入 /输出 请 求 而 需要 等 待 输入 /输出 操作 完成 ， 那 么 在 输入 /输出 操作 完成 之 前 ， 
处 理 器 将 一 直 处 于 空闲 状态 。 通 过 在 内 存 中 同时 存放 若干 道 均 已 准备 就 绪 和 可 以 执行 的 进 
程 ， 当 系统 执行 输入 /输出 操作 时 ， 处理 器 就 可 以 切换 到 男 一 进程 加 以 执行 。 从 运行 一 道 
进程 到 转 去 运行 男 一 道 进程 称 为 上 下 文 切换 ( context switching)。 不 过 ， 上 下 文 切 换 开 销 
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很 大 。 完 整 的 处 理 器 状态 必须 被 原原本本 地 保存 起 来 ， 以 便当 进程 在 后 来 重新 启动 时 可 以 
正确 地 恢复 。 总 的 来 说 ， 当 一 个 正在 运行 的 进程 (比如 说 ， 进 程 A) 请 求 输入 /输出 且 该 
输入 /输出 可 由 输入 /输出 控制 右 加 以 处 理 时 ， 操 作 系 统 的 处 理 器 调度 模块 应 检查 是 否 有 
任何 进程 处 于 就 绪 状 态 。 如 果 有 ， 则 某 个 就 绪 进 程 (比如 说 ， 进 程 B) 将 会 根据 处 理 器 调 
度 算法 被 选中 。 于 是 ， 操 作 系统 就 会 保存 进程 A 的 处 理 器 状态 (到 A 的 进程 控制 块 中 )， 
并 (从 B 的 进程 控制 块 中 ) 加 载 进程 B 的 处 理 器 状态 到 相应 的 处 理 器 寄存 器 中 。 然 后 ， 在 
进程 A 转换 为 等 待 (或 阻塞 ) 状态 的 同时 ， 处 理 器 将 把 处 理 器 的 控制 权 交 由 进程 B， 并 使 
其 转换 到 运行 状态 。 其 间 ， 进 程 A 将 始终 处 于 阻塞 状态 ， 直 到 对 应 的 输入 /输出 操作 完成 
为 止 。 

现在 ,包括 个 人 计算 机 在 内 的 大 多 数 计算 机 的 操作 系统 都 支持 多 任务 。 即 使 一 台 个 人 计 
算 机 常常 只 有 唯一 的 一 个 交互 式 用 户 ， 该 用 户 也 可 以 创建 多 个 任务 。 例 如 ， 如 果 显 示 屏 幕 上 
存在 多 个 窗口 ， 其 每 个 窗口 往往 是 由 一 个 独立 的 任务 或 进程 来 处 理 的 。 此 外 ， 还 有 其 他 任务 
可 能 在 后 台 正 在 运行 。 一 些 早 期 的 多 任务 操作 系统 只 能 处 理 批 处 理 作 业 ， 后 者 是 通过 读 卡 器 
或 其 他 老式 的 输入 /输出 设备 加 载 到 大 容量 磁盘 上 的 。 许 多 现在 的 系统 既 可 以 处 理 批 处 理 作 
业 ， 也 可 以 处 理 交 互 式 作业 。 交 互 式 作 业 是 指 那些 用 于 处 理 用 户 (通过 鼠标 、 键 盘 、 视 频 监 
探 显示器 和 其 他 交互 式 输入 /输出 设备 ) 直接 与 计算 机 进行 交互 的 进程 。 

我 们 还 可 以 进一步 区 分 出 两 种 类 型 的 多 任务 操作 系统 ， 即 通常 与 单一 用 户 〈single user) 
进行 交互 的 多 任务 操作 系统 和 支持 多 用 户 交 互 (multiple interactive user) 的 多 任务 操作 系统 。 
单 用 户 多 任务 系统 包括 大 多 数 支 持 窗口 化 平台 的 现代 个 人 计算 机 。 此 类 系统 中 ， 司 空 见 惯 的 
情形 是 ， 尽 管 只 有 一 个 用 户 在 与 系统 进行 交互 ， 但 该 用 户 可 能 同时 启动 了 多 个 任务 。 例 如 ， 
用 户 可 能 有 一 个 电子 邮件 程序 、 一 个 文本 编辑 器 和 一 个 网 络 浏览 器 ， 且 它们 在 同一 时 间 都 被 
打开 ， 每 个 程序 分 别 运行 在 一 个 独立 的 窗口 中 。 当 前 用 户 聚 焦 和 关注 的 任务 称 为 前 台 任 务 ， 
而 其 他 的 任务 则 称 为 后 台 任务 。 另 一 类 多 任务 系统 同时 处 理 与 多 个 用 户 之 间 的 交互 ， 故 而 也 
被 称 为 分 时 操作 系统 。 下 一 小 节 我 们 将 讨论 分 时 操作 系统 。 

在 我 们 的 螺旋 式 方法 部 分 ， 我 们 描述 了 单 用 户 多 任务 操作 系统 的 两 个 例子 ,一 个 是 第 4 
章 的 手持 式 掌 上 电脑 ( 即 Palm Pilot 设备 ) 上 的 操作 系统 ， 男 一 个 是 第 5 章 的 由 苹果 公司 开 
发 的 Mac 操作 系统 。 


2.4.3 ”分 时 操作 系统 和 服务 器 


多 用 户 操作 系统 ， 即 分 时 操作 系统 ， 也 支持 多 任务 处 理 , 但 是 ， 大 量 的 正在 运行 的 任务 
(进程 ) 是 在 处 理 用 户 与 系统 之 间 的 交互 。 之 所 以 称 为 分 时 系统 ， 是 因为 计算 机 的 时 间 被 许 
多 并 发 交互 式 用 户 所 “分 享 ”。 从 操作 系统 内 部 机 理 来 讲 ， 交 互 式 进 程 与 批 处 理 进程 之 间 的 
主要 区 别 是 它们 对 于 响应 时 间 的 要 求 。 交 互 式 作业 通常 支持 许多 短暂 的 交互 操作 ， 并 要 求 系 
统 对 每 一 个 交互 操作 做 出 迅捷 的 响应 。 但 是 交互 式 用 户 的 快速 响应 的 需求 要 求 高 水 平 的 上 下 
文 切换 ， 因 而 引入 了 大 量 的 非 生产 性 开销 。 另 一 方面 ， 批 处 理 作 业 不 涉及 现场 的 用 户 ， 所 以 
并 不 要 求 快速 响应 。 因 此 ， 仅 需要 较 少 的 上 下 文 切 换 ， 更 多 的 时 间 则 花费 在 生产 性 计算 方 
面 。 分 时 操作 系统 同时 支持 交互 式 作 业 和 批 处 理 作 业 ， 并 常常 赋予 交互 式 作 业 以 更 高 的 优先 
级 。20 世纪 六 七 十 年 代 ， 早 期 的 分 时 系统 ， 如 IBM 的 OS 360 TSO 操作 系统 82 和 Honey- 


名 OS 360TSO 代表 Operating System 360 Time Sharing Option， 即 带 有 分 时 选项 的 360 操作 系统 。 
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well (和 截 尼 韦 尔 公司 ) 的 MULTICS 操作 系统 ， 均 支持 大 量 的 交互 式 用 户 ， 不 过 所 有 用 户 都 
是 通过 哑 监 视 器 和 哑 终 端 登录 到 同一 系统 的 。 这 是 因为 终端 成 本 比 当时 的 计算 机 系统 要 便宜 
许多 数量 级 。 

伴随 硬件 和 处 理 器 价格 的 急剧 下 降 ， 分 时 需求 逐渐 减弱 。 在 现代 计算 领域 ,可 以 看 作 
交互 式 分 时 系统 继任 者 的 新 一 代 系 统 是 应 用 于 文件 服务 器 、 数 据 库 服务 器 和 万 维 网 服务 器 
(或 称 为 网 站 服务 器 ) 中 的 系统 。 文 件 服务 器 和 数据 库 服务 器 处 理 来 自 于 成 千 上 万 个 用 户 的 
访问 文件 和 数据 库 的 请 求 。 相 关 用 户 工作 在 个 人 计算 机 或 工作 站 上 (而 非 坐 在 与 进程 运行 
的 服务 器 相关 联 的 哑 终 端 前 面 )， 并 通过 网 络 向 服务 器 发 送 服务 请 求 。 大 型 的 数据 库 服 务 器 
通常 被 称 为 事务 处 理 系统 (transaction processing system)， 因 为 它们 每 秒 会 处 理 非常 多 的 
用 户 事务 。 网 站 服务 器 处 理 关于 网 络 文档 的 请 求 ， 并 经 常会 从 数据 库 服务 器 中 检索 和 获取 
一 些 文档 信息 。 数 据 库 服 务 器 和 网 站 服务 器 要 求 操作 系统 具备 处 理 成 百 上 千 个 并 发 进程 的 
能 力 。 : 


2.4.4 网 络 和 分 布 式 操作 系统 


现在 的 大 多 数 计算 机 ， 或 者 一 直 连 接 在 网 络 上 ， 或 者 配备 有 相关 设施 使 它们 可 以 跟 某 种 
类 型 的 网 络 进行 连接 和 断 开 。 这 便 允 许多 台 机 器 之 间 共 享 信息 和 资源 ,但 同时 也 要 求 操作 系 
统 为 这 些 网 络 连接 提供 相应 的 功能 。 相 关 功 能 可 以 划分 为 两 个 主要 层次 : 

1 ) 低级 的 网 络 访问 服务 (low-level network access service) 。 操 作 系 统 往往 具有 建立 网 
络 连接 以 及 在 相互 连接 的 机 器 之 间 发 送 或 接收 消息 等 附加 功能 。 

2 ) 高 级 服务 (higher-level service)。 用 户 常常 希望 能 够 连接 到 其 他 计算 机 上 ， 进 而 浏览 
信息 、 下 载 文档 (文本 、 图 片 、 歌 曲 ) 或 各 种 类 型 的 程序 ， 或 者 访问 数据 库 。 这 些 操作 一 般 
通过 网 络 浏览 器 或 特定 服务 例 程 (譬如 用 于 登录 到 远程 机 器 的 telnet 或 用 于 文件 传输 的 ftp) 
来 完成 。 正 如 我 们 先前 提 到 的 那样 ， 这 些 服务 在 某 些 人 看 来 是 独立 的 系统 程序 ， 而 在 另外 一 
些 人 看 来 则 属于 操作 系统 的 组 成 部 分 。 

就 像 我 们 将 在 第 15 章 所 看 到 的 那样 ， 标 准 的 网 络 协议 实际 上 会 提供 若干 层级 的 服务 ， 
从 基本 的 硬件 层级 到 用 户 交 互 层 级 。 与 网 络 连接 相对 独立 ， 分 布 式 操作 系统 可 以 提供 一 系列 
各 式 各 样 的 功能 。 一 个 非常 基础 的 分 布 式 操作 系统 ， 有 时 也 被 称 为 网 络 操作 系统 (network 
OS)， 提 供 了 从 用 户 登 录 的 一 台所 谓 客户 端 (client， 或 称 为 客户 机 ) 的 机 器 连接 到 一 台所 谓 
服务 器 ( server) 的 远 端 机 器 上 ， 并 访问 远程 服务 器 的 能 力 。 然 而 ， 客 户 端 用 户 必须 知道 他 
们 要 访问 的 特定 机 器 的 名 称 或 地 址 。 大 多 数 现 有 的 系统 至 少 会 提供 这 样 的 服务 水 平 。 例 如 ， 
telnet 和 ftp 服务 就 属于 这 一 层级 。 

另 一 种 极端 的 情况 是 ， 一 个 集大成 的 分 布 式 操作 系统 可 以 支持 用 户 登 录 到 一 台 客 户 端 机 
器 上 ， 透 明 地 访问 其 被 授权 访问 的 所 有 可 能 的 服务 和 文件 ， 甚 至 无 须知 道 相 关 服 务 和 文件 驻 
留 在 什么 地 方 。 这 时 ， 操 作 系统 本 身 将 负责 保存 目录 信息 ， 以 便 定位 任何 需要 的 文件 或 服务 
并 连接 到 适当 的 机 器 上 。 这 被 称 为 位 置 透明 性 ( location transparency)。 物 理 上 而 言 ， 相 关 
文件 和 服务 可 能 在 多 个 系统 上 进行 了 复制 ， 所 以 操作 系统 应 能 够 选择 最 方便 访问 或 最 可 高 效 
访问 的 副本 ， 称 为 复制 透明 性 9 (replication transparency)。 操 作 系 统 还 应 当 可 以 完成 动态 负 
载 均 衡 ( dynamic load balancing)， 即 当选 择 一 台 服 务 器 时 ， 能 够 选择 一 台 负 载 不 重 的 机 器 。 


怠 ”还 有 分 布 式 操作 系统 可 以 满足 的 许多 其 他 的 透明 性 ， 具 体 参见 第 17 章 。 
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这 样 的 操作 系统 显然 是 非常 复杂 的 ， 因 此 ， 除 了 在 专用 系统 或 研究 原型 领域 外 ， 尚 未 真正 出 
现 过 ! 

在 这 两 种 极端 情况 之 间 ， 人 们 可 以 考虑 各 种 类 型 的 分 布 式 操作 系统 ， 它 们 提供 的 功能 比 
最 小 功能 集 大 ， 但 比 完 整 的 期 望 功 能 集 小 。 


2.4.5 ”实时 操作 系统 


实时 操作 系统 属于 多 任务 操作 系统 ， 但 其 在 完成 一 些 或 全 部 任务 的 截止 时 间 方 面 有 特别 
的 要 求 。 如 下 为 两 种 类 型 的 截止 时 间 : 

1 ) 硬性 的 截止 时 间 (hard deadline)。 一 个 任务 具有 一 个 硬性 的 截止 时 间 ， 如 并 毫秒 ， 
意味 着 其 必须 在 提交 后 的 n 毫秒 内 完成 ; 否则 ， 错 过 了 截止 时 间 ， 任 务 的 完成 将 变 得 毫 无 意 
义 ， 甚 至 可 能 导致 极其 严重 的 后 果 。 此 类 任务 的 例子 包括 在 钢铁 厂 或 炼油 厂 的 工业 控制 任 
务 ， 或 武器 制导 系统 中 的 任务 。 

2 ) 软 性 的 截止 时 间 ( soft deadline)。 一 个 任务 具有 毫秒 的 软 性 截止 时 间 ， 意 味 着 其 
应 当 在 提交 后 的 n 毫秒 内 完成 , 但 是 ,该 截止 时 间 可 以 错过 且 不 会 造成 灾难 性 后 果 。 此 类 任 
务 的 例子 ， 如 虚拟 现实 游戏 中 伴随 用 户 移动 操作 而 更 新 显示 的 任务 。 

对 于 硬 实时 操作 系统 而 言 ， 其 调度 算法 在 决定 下 一 个 运行 的 进程 时 应 考虑 每 个 进程 的 截 
止 时 间 和 估计 运行 时 间 。 这 些 操作 系统 主要 应 用 在 飞机 或 过 程控 制 系统 等 设备 上 的 散人 式 系 
统 中 ， 其 做 出 关键 决策 的 软件 进程 必须 在 指定 的 截止 时 间 内 完成 。 另 一 方面 ， 对 软 实 时 系统 
而 言 ， 只 需要 对 那些 已 被 指定 为 实时 任务 的 任务 赋予 高 优先 级 别 即 可 。 为 此 ， 当 前 大 多 数 的 
操作 系统 ， 如 Windows 2000 或 Solaris， 均 提供 软 实时 支持 。 

令 人 遗憾 的 是 ， 大 多 数 操作 系统 中 已 经 发 展 到 能 够 提供 顺畅 的 平均 响应 时 间 的 大 多 数 技 
术 ， 无 一 例外 地 建立 在 统计 决策 的 基础 之 上 。 这 些 技术 在 硬 实时 系统 中 将 不 起 任何 作用 。 硬 
实时 系统 需要 独特 的 算法 来 实施 时 间 关 键 性 事件 的 调度 。 因 此 ， 我 们 不 会 花 太 多 的 时 间 来 讨 
论 这 样 的 系统 。 此 类 系统 最 好 单独 介绍 。 


2.5 ”操作 系统 构建 方法 
2.5.1 整体 式 单 内 核 操 作 系 统 方法 


第 一 批 操作 系统 均 被 分 别 写 到 了 唯一 的 一 个 程序 中 。 这 种 构建 操作 系统 的 方法 称 为 内 核 
方法 ( kernel approach) 或 整体 式 内 核 方法 ( monolithic kernel approach)， 如 图 1-3 所 示 。 伴 
随 整 体式 内 核 操作 系统 包含 越 来 越 多 的 功能 ， 其 规模 也 越 来 越 大 ， 在 某 些 情况 下 ， 从 几 千 字 
节 增 长 到 了 好 几 百 万 字 节 。 相 对 于 空间 有 限 且 价格 不 菲 的 内 存 来 讲 ， 普 遍 认为 操作 系统 的 存 
储 开销 (被 操作 系统 占用 的 内 存 的 百分比 ) 有 些 太 大 了 。 如 此 腔 肿 的 操作 系统 不 仅 占 用 更 多 
的 内 存 ， 而 且 像 大 多 数 大 型 的 程序 一 样 ， 其 效率 比 不 过 一 个 较 小 的 系统 ， 同 时 还 有 更 多 的 错 
误 且 很 难 维护 一 一 无 论 是 添加 功能 还 是 修复 错误 。 这 使 得 操作 系统 设计 人 员 开 始 基 于 一 个 更 
加 模块 化 和 分 层 设计 的 方法 来 开发 操作 系统 。 


2.5.2 分 层 式 操 作 系 统 方法 

发 展 起 来 的 模块 化 方法 是 一 种 分 层 式 体系 结构 ( layered architecture)。 整 个 操作 系统 被 
划分 为 若干 模块 ， 分 别 限定 完成 特定 的 功能 ， 如 处理 器 调度 或 内 存 管理 。 相 关 模 块 按 抽象 递 
增 的 次 序 组 织 为 几 层 ， 即 每 一 层 提供 了 一 个 更 为 抽象 的 系统 视图 ， 并 依赖 于 它 下 面 的 各 层 的 
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服务 。 这 种 分 层 式 方法 将 会 隐藏 处 理 硬 件 设 备 的 特殊 性 和 细节 ， 并 为 操作 系统 的 其 他 部 分 提 

供 一 个 通用 的 抽象 视图 。 因 此 ， 当 新 设备 进入 市 场 时 ， 新 的 设备 驱动 程序 可 以 被 添加 到 内 核 

而 不 会 极 大 地 影响 其 他 提供 内 存 管理 、 处 理 器 调度 和 文件 系统 接口 的 操作 系统 模块 。 图 2-4 
[33 | 以 一 种 非常 初步 的 方式 对 此 进行 了 说 明 。 





应 用 程序 接口 


图 2-4 操作 系统 的 分 层 式 模型 


这 种 方法 可 以 扩展 到 通过 若干 层 来 实现 一 个 操作 系统 。 其 变种 之 一 是 ， 仅 允许 n 层 的 
模块 调用 下 一 层 即 na-1 层 的 模块 。 其 另外 一 个 变种 是 允许 n 层 的 模块 调用 任何 较 低 层 (n-1 
层 、n-2 层 ， 等 等 ) 中 的 模块 。 还 有 一 个 更 进一步 的 变种 是 ， 除 允许 n 层 的 模块 调用 任何 较 
低层 的 模块 外 ， 还 允许 n 层 的 模块 与 a 层 的 其 他 模块 之 间 ( 即 同一 层 的 模块 之 间 ) 进行 相互 
调用 。 由 于 要 将 复杂 的 操作 系统 功能 划分 为 多 个 层次 非常 困难 ， 所 以 通常 在 实际 的 应 用 中 只 
使 用 两 层 或 三 层 。 在 后 面 的 章节 中 ， 我 们 将 会 分 析 和 讨论 分 层 式 设计 的 更 具体 的 实例 。 大 多 
数 现代 的 操作 系统 都 是 基于 分 层 式 体系 结构 建立 起 来 的 。 然 而 ， 一 些 操作 系统 编程 人 员 却 认 
为 ， 分 层 式 方法 是 远 远 不 够 的 ， 操 作 系统 的 设计 应 该 回归 到 内 核 代 码 的 最 小 化 ， 即 应 当 提 倡 
微 内 核 的 理念 。 


2.5.3” 微 内 核 操作 系统 方法 


微 内 核 ( microkernel) 方法 如 图 2-5 所 示 。 在 微 内 核 体 系 结构 中 ,包含 在 微 内 核 中 的 只 
有 基本 功能 ， 通 常 为 各 种 类 型 的 设备 驱动 程序 的 接口 。 确 切 地 说 ， 在 这 些 模块 中 仅 有 的 代 
码 是 那些 必须 运行 在 管 态 下 的 代码 ， 因 为 相关 代码 实际 使 用 了 如 保护 指令 等 特权 资源 ， 或 者 
访问 了 不 在 内 核 空间 中 的 内 存 。 操 作 系 统 功 能 的 其 余部 分 依然 是 常 驻 内 存 操作 系统 的 组 成 部 
分 ， 但 它们 是 在 用 户 模式 下 而 非 内 核 模式 下 运行 。 在 内 核 模式 下 运行 的 代码 简直 可 以 做 任何 
事情 ， 所 以 在 这 类 代码 中 发 生 的 错误 比 在 用 户 模式 下 运行 的 代码 发 生 的 错误 会 带 来 更 大 的 危 
害 。 因 此 ， 微 内 核 理论 认为 ， 该 方法 的 好 处 在 一 定 程度 上 源 自 于 “运行 在 管 态 的 代码 量 越 
少 ， 则 系统 越 健壮 ”的 事实 。 同 时 ， 微 内 核 方 法 也 使 得 相关 缺陷 会 更 容易 被 查 出 。 此 外 ， 尽 
管 需要 为 此 付出 一 些 额外 的 设计 努力 ， 但 却 可 以 使 正确 的 实施 变 得 更 为 可 能 。 最 后 ， 把 一 个 
小 的 微 内 核 移植 到 新 的 平台 上 要 远 比 移植 一 个 大 的 分 层 的 整体 式 内 核 容易 得 多 。 另 一 方面 ， 
微 内 核 必须 利用 中 断 来 实施 从 操作 系统 的 用 户 模式 部 分 到 其 特权 模式 部 分 的 调用 。 而 这 些 中 
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断 常常 需要 上 下 文 切换 。 微 内 核 方法 的 批评 人 士 说， 这 会 使 得 微 内 核 操 作 系 统 的 运行 速度 慢 
下 来 。( 应 当 指出 的 是 ， 这 个 议题 并 没有 在 操作 系统 社区 得 出 最 终结 论 。) 


应 用 程序 接口 





图 2-5 操作 系统 的 微 内 核 模型 


2.6 ”操作 系统 实现 中 的 一 些 问 题 和 技术 


正如 我 们 在 第 2.2 节 和 第 2.5 节 中 讨论 的 那样 ， 操 作 系 统 是 一 个 拥有 许多 模块 和 部 件 的 
复杂 的 软件 系统 。 与 任何 此 类 系统 一 样 ， 在 典型 操作 系统 的 内 部 实现 中 将 会 有 许多 数据 结构 
和 算法 。 在 这 一 节 中 ,我们 讨论 一 些 实现 技术 ， 它 们 是 大 多 数 操作 系统 甚至 所 有 操作 系统 的 
组 成 部 分 。 相 关 主 题 包 括 用 于 处 理 中 断 的 一 般 方 法 、 许 多 操作 系统 部 件 中 用 到 的 队列 和 数据 
结构 、 面 向 对 象 的 操作 系统 实现 方法 以 及 虚拟 机 。 


2.6.1 基于 中 断 向 量 的 中 断 处 理 


正如 我 们 多 次 提 到 的 那样 ， 中 断 (interrupt) 是 被 操作 系统 利用 的 一 种 机 制 ， 其 用 来 向 
系统 发 送信 号 ， 提 醒 系 统 发 生 了 某 件 需要 立即 关注 的 高 优先 级 的 事件 。 许 多 中 断 事件 与 输入 / 
输出 相关 联 。 一 些 常 见 的 中 断 事件 ， 或 者 以 信号 告知 读 或 写 磁盘 块 已 经 完成 ， 或 者 以 信号 告 
知 鼠 标 按钮 已 被 点 击 ， 或 者 以 信号 告知 键盘 按键 已 被 按 下 。 正 如 我 们 所 看 到 的 ， 大 多 数 此 类 
中 断 对 应 于 一 些 硬 件 操作 。 硬 件 通过 一 个 特定 的 中 断 号 与 每 个 中 断 事 件 相 关联 。 当 相应 的 事 
件 发 生 时 ,中断 控 制 器 通常 会 将 此 中 断 号 放 管 在 一 个 中 断 寄存 器 中 。 根 据 特定 类 型 的 中 断 事 
件 ， 操 作 系统 必须 采取 相应 的 行动 。 这 里 出 现 的 问题 是 : 如 何 高 效 地 确定 发 生 了 哪 项 特定 的 
中 断 事件 以 及 如 何 启动 服务 于 该 中 断 的 相应 过 程 ? 

中 断 处 理 的 一 般 技术 是 采用 一 种 称 为 中 断 向 量 ( interrupt vector) 的 数据 结构 (如 图 2-6 
所 示 )。 对 于 每 个 中 断 号 ， 该 向 量 中 均 有 相对 应 的 一 个 表 项 。 该 表 项 中 包含 对 应 中 断 类 型 的 
中 断 服 务 例 程 的 内 存 地 址 。 在 中 断 寄 存 器 中 放置 的 中 断 号 被 用 作 中 断 向 量 的 一 个 索引 。 中 断 
向 量 表 项 被 硬件 提取 出 来 作为 地 址 ， 同 时 硬件 将 以 子 程序 方式 来 实际 调用 相应 的 中 断 处 理 例 
程 。 当 中 断 例 程 完成 后 ， 其 将 仅仅 是 从 调用 返回 ,恢复 被 中 断 的 进程 。 

在 只 有 少许 输入 /输出 设备 的 小 型 姐 入 式 系统 中 ,硬件 可 能 并 不 提供 中 断 系统 ， 而 
是 选用 了 一 种 所 谓 的 状态 驱动 ( status-driven) 的 系统 。 在 此 类 系统 中 ， 应 用 程序 (或 操 
作 系 统 ) 基本 上 就 是 一 个 大 循环 ， 通 过 顺 次 检查 每 台 设备 的 状态 来 确认 相关 设备 是 否 需 要 
服务 。 
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中 断 向 量 
1 号 中 断 服务 例 程 入 口 地 址 
中 断 寄存 器 2 号 中 断 服务 例 程 人 口 地 址 


A 








入 号 中 断 服务 例 程 入 口 地 址 
图 2-6 用 于 处 理 中 断 的 中 断 向 量 


2.6.2 ”系统 调用 


一 般 而 言 ， 应 用 程序 需要 使 用 操作 系统 管理 的 数据 和 服务 。 例 如 ， 操 作 系统 通常 管理 着 
系统 上 的 所 有 硬件 设备 《如 声卡 )， 而 应 用 程序 并 不 能 直接 访问 这 些 硬件 设备 。 同 时 ， 应 用 
程序 之 间 可 能 需要 相互 通信 ， 于 是 操作 系统 不 得 不 承担 起 中 介 的 角色 。 

任何 普通 的 应 用 程序 都 应 当 能 够 使 用 操作 系统 管理 的 数据 和 服务 ， 且 其 采用 系统 调用 
( system call) 的 方式 来 向 操作 系统 请 求 服务 。 系 统 调用 非常 类 似 于 任何 其 他 的 函数 调用 。 首 
先 ， 应 用 程序 利用 描述 所 需 服务 的 信息 来 加 载 某 些 寄存 器 ， 然 后 执行 一 个 系统 调用 指令 。 然 
而 ， 系 统 调用 指令 通常 会 触发 一 个 即将 由 操作 系统 来 处 理 的 中 断 ， 而 不 是 直接 去 调用 一 段 用 
于 完成 相关 功能 的 代码 。 操 作 系统 将 执行 所 需 的 服务 ， 然 后 将 控制 返回 给 应 用 程序 。 这 种 机 
制 还 支持 操作 系统 通过 首先 检查 来 确认 应 用 程序 是 否 允 许 以 所 请 求 方式 访问 资源 ， 从 而 实现 
某 种 程度 的 安全 。 

一 般 情况 下 ， 应 用 程序 开发 系统 会 提供 一 个 库 ， 该 库 经 过 加 载 后 将 作为 应 用 程序 的 组 成 
部 分 。 于 是 ， 就 由 该 库 负 责 处 理 把 信息 传递 给 内 核 以 及 执行 系统 调用 指令 等 具体 细节 。 通 过 
该 库 提供 的 相关 功能 ， 降 低 了 操作 系统 和 应 用 程序 之 间 的 关联 强度 ， 提 高 了 应 用 程序 的 可 移 
植 性 。 


2.6.3 ”队列 和 表 


操作 系统 通过 管理 许多 数据 结构 来 完成 其 各 项 任务 。 表 和 队列 是 常用 的 两 种 数据 结构 。 
表 是 用 来 存储 操作 系统 管理 的 各 种 对 象 的 相关 信息 的 。 例 如 ， 在 第 2.2 节 中 描述 的 进程 控制 
块 ， 就 是 表 的 一 个 例子 ,操作 系统 通过 维护 该 表 来 记录 和 跟踪 与 每 个 进程 相关 联 的 信息 。 页 
表 (page table) 是 男 一 种 常见 的 表 ， 在 硬件 支持 分 页 内 存 管理 ( 见 第 11 章 ) 的 情况 下 用 于 记 
录 进 程 的 地 址 空间 。 对 于 每 个 进程 来 说 ， 操 作 系 统 会 为 其 维护 一 个 进程 控制 块 和 一 个 页 表 。 
还 有 一 种 典型 的 表 是 打开 文件 表 (open file table)， 其 为 系统 中 打开 的 每 个 文件 建立 和 保存 了 
一 个 表 项 。 

操作 系统 还 维护 了 一 些 队列 ， 用 于 记录 按 某 种 方式 有 序 的 相关 信息 。 可 被 多 个 进程 共享 
的 每 个 资源 都 需要 一 个 队列 来 保存 该 资源 的 相关 服务 请 求 。 例 如 ， 由 于 多 个 进程 可 能 都 需要 
读 写 磁盘 页 ， 所 以 操作 系统 就 维护 了 一 个 磁盘 调度 队列 ( disk scheduling queue)， 用 于 记录 
等 待 磁盘 输入 /输出 的 进程 列表 。 打 印 机 服务 的 请 求 可 以 保存 在 打印 机 队列 ( printer queue) 
中 。 而 准备 就 绪 、 等 待 运行 的 相关 进程 的 列表 则 可 以 保存 在 就 绪 进 程 队列 ( ready process 
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queue) 中 。 

许多 这 些 “ 队 列 ” 并 非 严 格 意义 上 的 队列 ， 因 为 真正 的 队列 总 是 按照 先 人 先 出 〈First-In- 
First-Out，FIFO) 的 原则 进行 管理 的 。 但 是 ， 利 用 队列 的 调度 算法 决定 了 队列 中 的 元 素 的 顺 
序 。 例 如 ， 如 果 选 择 下 一 个 要 运行 的 进程 的 策略 是 优先 级 策略 ， 那 么 就 绪 进 程 队 列 的 调度 程 
序 应 当 实现 相应 的 策略 。 在 先进 先 出 的 情况 下 ， 每 一 个 新 的 元 素 均 应 被 放置 在 队列 的 末尾 。 
当 处 理 器 需要 执行 一 个 新 的 进程 时 ， 它 将 从 队 首 移出 一 个 元 素来 进行 处 理 。 正 如 我 们 将 会 看 
到 的 那样 ， 存 在 各 种 各 样 的 队列 组 织 方式 ， 这 具体 取决 于 每 种 类 型 队列 的 特殊 要 求 。 

队列 中 的 每 个 元 素 都 必须 包含 操作 系统 用 于 确定 动作 取向 所 需 的 所 有 信息 。 例 如 ， 每 个 
就 绪 队 列 元 素 可 能 包含 指向 就 绪 进 程 的 进程 控制 块 的 指针 。 通 过 该 指针 访问 对 应 的 进程 控制 
块 ， 操 作 系统 就 能 够 检索 和 获取 到 所 需 的 进程 信息 。 


2.6.4 面向 对 象 的 方法 


有 一 种 开发 操作 系统 的 方法 是 基于 面向 对 象 软件 工程 的 原理 和 开发 实践 ， 并 将 其 运用 于 
操作 系统 的 设计 及 实现 。 根 据 这 种 方法 ， 每 个 操作 系统 模块 应 当 被 设计 为 一 个 对 象 object) 
集合 ， 而 每 个 对 象 应 当 包含 方法 ( method)， 用 于 为 操作 系统 其 他 部 分 或 应 用 程序 提供 服务 。 
采用 对 象 方式 来 构建 操作 系统 能 够 提供 面向 对 象 软件 工程 的 许多 优点 ， 璧 如 对 象 数据 结构 的 
封装 、 接 口 与 实现 的 相对 独立 、 对 象 重用 的 可 扩展 性 和 易 用 性 ， 以 及 许多 其 他 的 优势 。 简 
单 来 说 ， 对 象 的 关键 特征 在 于 对 象 的 内 部 结构 是 隐藏 的 ， 而 针对 对 象 中 所 含 数 据 的 任何 访问 
都 需 通 过 对 象 的 方法 来 进行 。 这 就 使 得 应 用 程序 不 太 可 能 由 于 误 用 对 象 而 引发 其 他 模块 的 
问题 。 

已 经 有 多 起 制作 面向 对 象 操作 系统 的 尝试 ， 最 著名 的 要 数 NeXT 计算 机 公司 的 NextStep 
操作 系统 ( NextStep 0S) 和 Be 公司 的 BeOS 操作 系统 。 一 些 研 究 项 目 也 应 运 而 生 ， 最 出 名 
的 如 Choices、Athene、Syllable、TAJ 以 及 JNode (用 Java 语言 编写 的 操作 系统 )。 不 过 ， 
似乎 还 未 有 哪个 主要 的 操作 系统 是 真正 基于 对 象 构建 的 。 通 常情 况 下 ， 内 核 模块 采用 C 语 
言 或 汇编 语言 编写 ， 库 则 提供 面向 对 象 接口 方式 的 应 用 程序 接口 ， 从 而 能 够 在 大 多 数 提供 对 
象 支持 的 高 级 语言 中 被 调用 。Windows NT 就 是 典型 的 此 类 操作 系统 ， 其 各 模块 内 部 的 数据 
结构 并 不 是 对 象 。 


2.6.5 ”虚拟 机 


另外 还 有 一 种 关于 操作 系统 设计 的 方法 是 利用 软件 模拟 器 来 抽象 或 虚拟 化 (virtualizing) 
整个 系统 (包括 设备 、 处 理 器 和 内 存 ) 的 技术 。 相 关 概 念 被 称 为 虚拟 机 ( Virtual Machine， 
VM)。 引 入 虚拟 机 的 一 个 主要 原因 是 ， 其 可 以 保护 一 个 仿真 环境 避免 受到 其 他 仿真 环境 的 影 
响 ， 因 而 一 个 程序 的 崩溃 不 会 影响 和 蔓延 到 其 他 程序 上 ， 即 不 会 导致 其 他 程序 发 生前 省 。 这 
种 被 抽象 的 系统 设计 可 以 是 一 个 实际 的 硬件 设计 ， 也 可 以 是 一 个 理想 模式 的 应 用 程序 虚拟 机 。 

硬件 级 虚拟 机 

在 这 种 方法 中 ， 程 序 或 内 核子 系统 将 提供 一 部 实际 的 硬件 机 器 的 软件 仿真 。 其 具体 包括 
两 种 不 同类 型 的 仿真 ， 一 种 是 主机 硬件 系统 本 身 被 仿真 ， 另 一 种 则 指 被 模拟 的 是 另外 的 一 种 
处 理 器 。 后 一 种 类 型 往往 由 制造 商 开 发 ， 通 过 提供 一 个 程序 来 模拟 旧 系 统 ， 从 而 协助 客户 从 
一 个 旧 系 统 迁 移 到 一 个 新 系统 。 例 如 ，IBM 开发 了 许多 不 同类 型 的 仿真 软件 包 ， 以 帮助 客户 
从 1401 系统 迁移 到 普遍 使 用 的 360 系列 上 。 在 这 种 情况 下 ， 仿 真 通常 是 由 运行 在 用 户 模式 


L37 | 


30 ”党 一 部 分 失 从 系统 本 述 


下 的 应 用 程序 来 完成 的 。 

主机 的 仿真 经 常 被 用 来 支持 多 个 操作 系统 内 核 
同时 运行 ， 如 图 2-7 所 示 。 在 这 种 情况 下 ,仿真 是 
由 一 个 特殊 的 主机 操作 系统 ( host OS) 的 内 核 来 完 
成 的 。 该 模型 支持 一 个 或 多 个 操作 系统 内 核 作 为 客 
户 机 操作 系统 ( guest OS) 运行 在 虚拟 机 层级 上 。 虚 
拟 机 层级 创建 了 一 个 接口 来 抽象 硬件 ， 从 而 使 每 个 
内 核 都 认为 自己 是 在 硬件 上 独自 运行 的 。 这 些 内 核 
可 以 源 自 不 同 的 操作 系统 ， 也 可 以 是 同一 种 操作 系 
统 的 不 同 实例 S98。 虚 拟 机 模型 的 主要 困难 之 一 是 创建 
一 台 准 确 模拟 硬件 的 虚拟 机 ， 从 而 使 内 核 可 以 像 
直接 运行 在 真实 硬件 上 一 样 而 运行 在 虚拟 机 上 ( 仅 
仅 慢 一 些 而 已 ， 因 为 它们 实际 上 是 在 与 其 他 内 核 
分 享 着 硬件 ) 。 第 一 批 中 的 一 个 (如 果 不 是 第 一 个 ) 图 2-7 硬件 虚拟 机 
这 种 类 型 的 仿真 软件 包 是 由 IBM 为 360 模型 的 改进 版 40 而 创建 的 ， 称 为 CP-40。 其 上 面 运 
行 着 客户 机 操作 系统 一 一 特别 是 剑桥 监控 系统 (Cambridge Monitor System，CMS) 的 多 个 
实例 。 那 个 早期 的 软件 包 已 被 重新 实现 过 好 多 次 ， 目 前 的 版 本 ， 即 zz-VM， 运 行 在 z9 系列 主 
局 本 

现在 ， 虚 拟 机 系统 已 经 变 得 相当 普遍 了 。 人 们 很 容易 想象 ， 让 一 个 操作 系统 运行 在 男 一 
个 操作 系统 上 不 会 特别 高 效 。 为 此 ， 当 代 的 虚拟 机 操作 系统 通常 运行 的 是 经 过 略微 修改 的 客 
户 机 操作 系统 版 本 ， 后 者 很 清楚 自己 是 运行 在 虚拟 机 环境 下 并 以 一 种 略微 不 同 的 方式 来 处 理 
事情 ， 从 而 使 虚拟 机 仿真 能 够 更 加 高 效 。 此 外 ， 再 新 一 点 的 处 理 器 还 常常 提供 了 支持 虚拟 化 
的 额外 指令 和 其 他 功能 。 

应 用 级 虚拟 机 

现在 ， 把 术语 虚拟 机 应 用 到 任何 创建 抽象 机 的 软件 的 情况 随处 可 见 。 有 时 ， 所 模拟 
的 机 器 并 非 一 个 真实 的 处 理 器 ， 而 是 一 个 试图 支持 一 种 特定 语言 或 一 大 类 语言 的 理想 化 
的 机 器 设计 规范 。 这 样 的 系统 有 时 被 称 为 应 用 程序 虚拟 机 或 应 用 级 虚拟 机 。 一 个 早期 的 
此 类 设计 被 称 为 p-code 系统 ， 由 加 利 福 尼 亚 大 学 圣地 亚 哥 分 校 设 计 ， 用 于 支持 他 们 的 
Pascal 系统 。 目 前 非常 流行 的 虚拟 机 是 Java 虚拟 机 ( Java Virtual Machine，JVM)， 其 
创建 了 一 部 运行 Java 程序 的 抽象 机 。 有 时 ，Java 虚拟 机 以 支持 Java 程序 执行 的 独立 软件 
包 的 方式 运行 。 还 有 一 些 情况 ， 虚 拟 机 仿真 可 能 是 在 另 一 个 程序 (如 网 络 浏览 器 ) 的 内 部 。 
这 时 ，Java 程序 在 可 做 事情 方面 有 更 多 的 限制 。 另 外 一 个 此 类 的 软件 包 是 由 微软 开发 的 
通用 语言 运行 库 (Common Language Runtime，CLR)， 用 于 支持 他 们 的 .net 体系 结构 。 
在 这 种 情况 下 ， 抽 象 机 被 设计 用 来 支持 一 大 类 语言 ( 即 好 多 语言 )， 而 不 是 一 种 单一 的 
语言 。 

由 于 虚拟 机 仿真 可 能 有 点 低 效 ， 所 以 开发 和 运行 在 应 用 级 虚拟 机 上 的 代码 经 常 被 编译 成 
本 地 机 器 码 ， 以 便 它 会 运行 得 更 快 些 。 相 关 技 术 被 称 为 即时 (Just-in-Time，JIT) 编译 。 通 
过 即时 编译 产生 的 二 进 制 代码 通常 在 执行 后 就 会 被 丢弃 掉 ， 不 过 其 也 可 以 被 永久 保存 下 来 供 








9 事实 上 ,IBM 创立 虚拟 机 概念 的 部 分 缘由 是 为 了 支持 操作 系统 编程 人 员 测试 内 核 ， 这 样 ， 即 便 正 在 调试 
的 内 核 崩溃 掉 了 ， 其 他 内 核 依然 可 以 继续 正常 运行 。 
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以 后 重复 使 用 。 


2.7 ”操作 系统 功能 及 向 后 兼容 的 最 小 化 方法 和 最 大 化 方法 

我 们 以 一 场 关于 “什么 功能 应 当 包括 在 操作 系统 里 ?” 的 讨论 来 结束 这 一 章 。 换 句 话 说， 
操作 系统 究竟 应 该 做 什么 呢 ? 这 是 一 个 很 大 的 问题 。 让 我 们 用 某 种 哲学 的 目光 来 审视 一 下 这 
个 问题 。 一 个 极端 是 最 小 化 〈minimalist) 哲理 ， 即 只 有 那些 真正 要 进入 内 核 (或 微 内 核 ) 的 
东西 才 包 含 在 操作 系统 里 。 其 他 部 件 则 可 以 添加 到 库 例 程 或 作为 “用 户 ” 程 序 (不 是 内 核 的 
组 成 部 分 , 但 通常 并 不 由 用 户 编写 )。 男 一 个 极端 是 最 大 化 ( maximalist) 哲理 ， 即 把 大 部 分 
常用 的 服务 都 放 到 操作 系统 里 。 例 如 ， 如 果 最 大 化 哲学 被 采用 ， 诸 如 屏幕 窗口 管理 等 服务 就 
应 包含 在 操作 系统 内 核 里 ， 因 为 几乎 每 个 人 都 使 用 该 项 服务 。 

最 小 化 主义 者 争辩 说 ， 他 们 的 方法 允许 每 个 用 户 都 可 以 选择 他 们 想 要 的 东西 。 例 如 ， 用 
户 可 以 从 一 大 群 窗口 管理 器 中 进行 选择 ， 而 如 果 喜 欢 ， 事 实 上 可 以 选择 两 个 甚至 更 多 。 这 便 
使 得 更 容易 选择 部 件 和 建立 所 要 的 配置 。 用 户 甚至 可 以 编写 新 的 部 件 。 最 小 化 主义 者 还 辩 
称 ， 这 种 方法 使 操作 系统 模块 易于 设计 和 编码 ， 且 更 易于 调试 。 他 们 经 常 宣称 由 此 形成 的 系 
统 “ 更 简练 ” 或 “更 干净 ”。 

最 大 化 主义 者 反 驱 道 ， 在 一 些 基 本 领域 用 户 选择 是 一 个 问题 ,这 太 灵 活 了 。 他 们 宣扬 共 
同 的 “外 观 和 感觉 "， 因 为 常见 的 应 用 程序 功能 (如 滚动 条 、 菜 单 和 移动 光标 ) 应 考虑 到 使 
用 上 的 更 一 致 化 和 让 用 户 更 满意 。 这 可 以 使 用 户 更 容易 理解 关于 应 用 程序 如 何 工作 等 基础 知 
识 ， 并 建立 起 应 用 程序 之 间 的 一 致 性 。 他 们 声称 ， 诸 如 在 屏幕 上 绘画 、 移 动 鼠 标 以 及 菜单 等 
常见 功能 ,几乎 每 一 个 应 用 程序 都 会 用 到 ， 故 而 应 该 在 一 个 地 方 即 操作 系统 里 高 效 一 致 地 完 
成 。 他 们 还 断言 ， 有 些 功 能 可 能 在 操作 系统 里 更 高 效 ， 而 其 他 一 些 功 能 ， 璧 如 安全 功能 ， 则 
必须 在 内 核 中 完成 。 

事实 上 ， 几 乎 没有 什么 操作 系统 是 真 的 最 小 化 或 最 大 化 一 和 大 多 数 争论 一 样 ， 选 择 
是 由 大 剂量 的 “真实 世界 ”注入 讨论 中 做 出 的 。 例 如 ， 如 果 我 们 研究 手持 小 电脑 (掌上 电 
脑 ) 的 操作 系统 ， 许 多 现实 世界 的 问题 就 会 影响 到 设计 的 选择 。 这 些 问 题 包括 非常 有 限 的 
内 存 ， 因 此 应 当 把 尽 可 能 多 的 功能 放 到 操作 系统 里 ， 从 而 通过 共享 例 程 使 应 用 程序 减少 对 
内 存 的 使 用 。 男 一 个 问题 是 ,制造 共同 的 外 观 和 感觉 , 但 是 仅仅 包括 那些 最 普遍 需要 的 例 
程 ， 以 避免 每 个 人 都 需要 为 不 经 常 使 用 的 服务 所 占用 的 内 存 而 支付 额外 的 款项 。 


2.7.1 向 后 兼容 


最 后 一 个 问题 ， 向 后 兼容 (backward compatibility， 译 者 注 : 又 称 向 下 兼容 ，downward 
compati-bility) 是 成 功 的 代价 。 这 个 问题 给 操作 系统 的 设计 人 员 和 实现 人 员 所 带 来 的 困难 要 
远 远 高 于 能 够 想象 到 的 情况 9S。 向 后 兼容 是 指 在 新 版 本 操作 系统 上 运行 旧 的 应 用 程序 的 能 
力 。 这 种 能 力 几乎 是 任何 操作 系统 的 每 一 个 新 版 本 的 一 个 卖点 。 事 实 上 ,其 至 没有 先前 版 本 
的 新 操作 系统 也 会 宣称 ， 能 够 透明 地 (无 须 修改 地 ) 运行 为 其 他 (流行 ) 操作 系统 开发 的 
应 用 程序 。 请 注意 ， 这 意味 着 可 执行 程序 (二进制 代码 ) 必须 不 经 改变 就 能 在 新 系统 上 
运行 。 

有 些 系统 声称 新 系统 是 “ 源 代 码 兼 容 ” 的 ， 也 就 是 说 ， 应 用 程序 从 旧 系 统 迁移 到 新 系 
统 ， 其 源码 必须 重新 编译 ， 但 不 一 定 发 生 了 变化 。 这 对 于 购买 了 程序 但 却 只 有 可 执行 文件 


龟 别 忘 了 ， 仅 仅 把 系统 中 的 旧 代码 遗弃 就 多 难 ! 
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的 人 来 说 没有 任何 帮助 ! 这 不 仅 要 求 操作 系统 的 每 一 个 新 版 本 都 应 当 包 含 以 前 版 本 中 的 所 
有 服务 ， 而 且 相 关 服 务 也 必须 以 相同 的 方式 来 工作 ， 即 使 那些 新 服务 做 相同 或 类 似 的 事情 
可 能 更 高 效 和 更 安全 。 一 个 最 可 怕 的 问题 是 ， 其 至 漏洞 一 一 那些 可 能 已 被 发 现 的 一 一 也 必 
须 保留 下 来 ， 因 为 某 些 应 用 程序 可 能 已 经 利用 了 那些 漏洞 的 相关 功能 。 例 如 ， 在 微软 的 
DOS 系统 中 有 一 个 闻名 退 途 的 支持 文件 大 小 截断 〈 即 让 文件 大 小 收缩 ) 的 漏洞 ， 就 在 操 
作 系 统 的 许多 版 本 里 保留 了 几 十 年 (甚至 穿越 到 Windows 系统 )。 因 为 在 原先 的 “有 漏 
洞 ”的 版 本 里 ， 没 有 其 他 方法 可 以 截断 文件 。 不 久 ， 该 漏洞 在 一 个 版 本 里 被 修复 ， 但 为 了 
兼容 已 经 存在 的 可 执行 文件 ， 修 复 是 以 扩展 〈 即 新 服务 ) 方式 完成 的 。 旧 的 服务 依旧 保留 
“ 原 有 漏洞 ”。 (兼容 性 问题 有 时 隐藏 在 下 面 这 名 名 言 里 :“ 这 不 是 一 个 污点 一 一 这 是 一 个 
特点 ! ”) 


2.7.2 用户 最 优化 与 硬件 最 优化 


最 后 一 点 : 个 人 计算 机 已 经 把 操作 系统 的 传统 目标 颠倒 过 来 了 。 直 到 个 人 计算 机 出 现 之 
前 ， 操 作 系统 的 主要 目标 之 一 始终 是 优化 一 堆 非常 昂贵 的 硬件 的 利用 率 。 这 意味 着 应 充分 利 
用 价格 昂贵 的 内 存 的 每 一 位 (由 此 曾 导 致 了 臭名 昭著 的 千年 虫 问 题 ， 即 Y2K bug)、 慢 慢 腾 
腾 的 处 理 器 的 每 个 指令 周期 ,以 及 容量 有 限 但 价格 不 菲 的 磁盘 驱动 器 的 每 个 局 区 。 然 而 ， 一 
且 集 成 电路 的 水 平 使 个 人 计算 机 的 生产 变 得 相当 便宜 ， 整 个 系统 最 昂贵 的 部 分 就 变 成 了 坐 在 
显示 器 前 面 的 用 户 ， 而 不 是 坐落 在 显示 器 后 面 的 装置 。 这 意味 着 ,操作 系统 需要 非常 灵敏 地 
响应 键盘 ， 并 尽 可 能 快速 流畅 地 更 新 屏幕 显示 ， 即 使 那样 做 将 会 伴随 处 理 器 的 低 效 使 用 。 图 
形 化 用 户 界面 是 一 个 很 好 的 例子 。 如 果 我 们 仍然 仅仅 使 用 着 每 台 价值 一 百 万 美元 的 大 型 机 系 
统 ， 图 形 化 用 户 界面 将 是 最 有 可 能 不 再 那么 普遍 的 。 


2.8 小 结 


在 本 章 中 ， 我 们 首先 给 出 了 一 个 简单 的 用 户 场 景 ， 并 就 该 场景 下 操作 系统 采取 的 一 些 
动作 进行 了 描述 。 然 后 ， 我 们 概要 介绍 了 操作 系统 管理 的 系统 资源 的 主要 类 型 ， 并 讨论 了 主 
要 的 操作 系统 模块 。 接 着 ， 我 们 针对 操作 系统 所 完成 事项 的 核心 所 在 ， 即 进程 的 概念 进行 了 
定义 ， 并 描述 了 进程 的 状态 以 及 由 操作 系统 维护 的 关于 每 个 进程 的 一 些 信息 。 我 们 还 讨论 了 
不 同类 型 的 操作 系统 的 特点 ， 从 每 次 可 以 执行 一 个 单一 进程 的 系统 到 管理 并 发 执行 进程 的 系 
统 ， 再 到 分 时 系统 和 分 布 式 系统 。 

在 此 基础 上 ,我 们 阐明 了 构建 操作 系统 所 采取 的 一 些 不 同体 系 结构 和 方法 ， 具 体 包 括 整 
体式 操作 系统 、 微 内 核 体系 结构 和 分 层 式 体系 结构 。 我 们 讨论 了 操作 系统 维护 的 一 些 常见 的 
数据 结构 (如 中 断 向 量 和 队列 )、 面 向 对 象 的 系统 以 及 虚拟 机 。 最 后 ,我 们 以 一 场 关于 操作 
系统 功能 的 最 小 化 方法 与 最 大 化 方法 的 哲学 讨论 而 结束 本 章 。 
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哪些 是 操作 系统 必须 管理 的 资源 类 型 ? 
程序 与 进程 之 间 的 区 别 是 什么 ? 
进程 可 能 的 状态 有 哪些 ? 
多 少 个 进程 可 以 同时 处 于 运行 状态 ? 
什么 类 型 的 事件 可 以 触发 从 运行 状态 到 终止 状态 的 转换 ? 
至 少 给 出 进程 可 能 等 待 的 几 件 事 情 的 名 称 。 
进程 控制 块 中 存放 的 一 些 信息 并 不 总 是 及 时 更 新 。 请 举 出 一 些 此 类 信息 的 例子 。 
列举 用 户 进程 、 系 统 进程 、 操 作 系 统 进程 三 类 进程 的 一 些 例子 。 
本 章 讨 论 了 操作 系统 总 体 设计 的 5 种 不 同类 型 。 如 下 实例 分 别 属于 什么 设计 类 型 ? 
a. 手持 式 计 算 机 和 掌上 电脑 上 的 操作 系统 
b. UNIX 
c. Novell Netware 
d. 磁带 录像 机 (Video Cassette Recorder，VCR) 
e. 汽 车 发 动机 
如 果 我 们 编写 应 用 程序 ， 需 要 操作 系统 为 我 们 管理 硬件 的 理由 有 哪些 ? 
我 们 把 操作 系统 划分 为 独立 模块 的 理由 有 哪些 ? 
什么 是 “ 微 内 核 ”操作 系统 ? 
一 般 而 言 ， 面 向 对 象 的 程序 设计 的 效率 比 过 程 化 程序 设计 要 低 些 。 为 什么 我 们 想 用 低 效率 的 工 
具 来 制造 操作 系统 ? 
当 操 作 系统 从 设备 接收 到 中 断 时 ， 其 通常 采用 什么 机 制 来 选择 用 于 处 理 中 断 的 代码 ? 
应 用 程序 如 何 请 求 操 作 系 统 做 一 些 事 情 ? 
大 多 数 现代 的 操作 系统 都 是 虚拟 机 操作 系统 ， 目 前 这 种 状态 是 由 操作 系统 的 演化 造成 的 。 这 是 
真 的 还 是 假 的 ? 
现代 的 软件 虚拟 机 体系 结构 有 哪 两 种 ? 
你 认为 操作 系统 应 当 包 含 许 多 公共 的 系统 功能 ， 还 是 应 当 仅 包含 最 少量 的 功能 而 把 尽 可 能 多 的 
功能 放 到 另外 的 层级 和 库 中 ? 请 对 此 做 出 解释 。 
什么 是 应 用 程序 设计 可 以 依赖 的 最 标准 的 操作 系统 应 用 程序 接口 ? 
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渐进 式 构 建 操作 系统 : 
面 问 广度 的 螺旋 式 方法 





正 是 本 书 的 第 二 部 分 才 使 得 这 本 书 与 众 不 同 。 其 他 书籍 往往 倾向 于 就 围绕 
典型 操作 系统 不 同方 面 的 一 系列 分 离 的 主题 按 纵深 方向 、 披 此 孤立 地 分 别 展 开 讨 
论 。 本 书 则 不 然 ， 在 这 一 部 分 将 呈现 一 些 章节 ， 针 对 所 选 定 的 操作 系统 ， 阑 述 它 
们 是 如 何 伴随 底层 硬件 的 发 展 及 用 户 期 望 与 需求 的 增长 而 被 迫 演化 的 。 这 些 入 选 
的 系统 都 运行 在 某 种 类 型 的 个 人 计算 机 上 。 之 所 以 这 样 做 并 非 无 意 之 举 ， 而 是 经 
过 深思 熟 虑 的 。 这 在 一 定 程度 上 是 考虑 到 大 多 数学 生 热 悉 相 关 的 计算 机 ， 并 可 能 
在 之 前 已 经 见 到 过 许多 这 样 的 机 器 和 操作 系统 。 这 样 的 系统 也 是 学 生 最 有 可 能 接 
触 到 的 系统 ， 至 少 是 更 现代 的 系统 。 同 时 ,个 人 计算 机 操作 系统 的 演化 与 更 大 些 
的 机 器 上 的 操作 系统 的 演化 是 并 行 展 开 的 。 为 此 ， 个 人 计算 机 操作 系统 的 实例 ， 
从 最 原始 的 到 最 复杂 的 都 普遍 存在 。 而 许多 这 样 的 操作 系统 也 存在 于 更 大 些 的 机 
器 上 ， 包 括 现在 一 些 最 大 的 大 型 机 上 也 能 找到 。 

第 二 部 分 包括 S 章 。 第 3 章 讨 论 了 一 种 早期 的 个 人 计算 机 操作 系统 ， 即 CP/ 
M。 这 是 一 种 单 用 户 、 单 任务 操作 系统 ， 且 没有 图 形 化 用 户 界面 (Graphical User 
Interface，GUI)。 其 仅 支持 平坦 型 文件 系统 ( 即 单 级 文件 系统 )。 就 这 点 来 说 ， 其 
非常 类 似 于 早期 的 大 型 机 操作 系统 ， 如 IBM 709x 系列 机 上 的 IBSYS。 我 们 阐明 
了 在 这 些 简单 系统 中 的 操作 系统 应 有 的 所 有 基本 机 制 ， 包 括 内 核 与 操作 系统 的 分 
离 以 及 对 文件 系统 的 支持 。 

在 第 4 章 ， 我们 研究 了 一 个 引入 另外 两 种 理念 的 操作 系统 : 一 是 同时 运行 多 
个 程序 的 想法 ， 二 是 图 形 化 用 户 界 面 的 使 用 。 所 涵盖 的 操作 系统 为 许多 掌上 电脑 
和 手机 上 都 在 使 用 的 Palm 操作 系统 ( Palm OS)。 这 两 项 额外 的 要 求 必需 有 额外 
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的 操作 系统 机 制 加 以 支持 ， 尤 其 是 处 理 器 抽象 和 进程 控制 块 。 掌 上 电脑 和 手机 系 
统 通常 都 没有 辅助 存储 设备 ， 但 它们 仍然 支持 文件 系统 的 概念 ， 因 为 应 用 程序 员 
对 “隐喻 修辞 方法 ”( 译 者 注 : 此 处 应 当 指 把 内 存 当 作 外 存 使 用 来 支持 文件 系统 的 
做 法 ) 非常 熟悉 。 它 们 确实 有 一 个 图 形 化 用 户 界面 ， 但 屏幕 的 使 用 受到 对 应 非常 
小 的 屏幕 尺寸 的 限制 。 我 们 还 讨论 了 这 两 种 限制 情况 对 操作 系统 设计 的 影响 。 

第 5 章 讨论 的 操作 系统 系列 则 又 引入 了 其 他 一 些 需 求 。 这 就 是 麦 金 塔 ( Mac- 
intosh， 或 简称 为 Mac 或 MAC) 系列 操作 系统 ， 其 设计 从 一 开始 就 关注 到 了 辅 存 。 
该 族 操作 系统 的 进化 很 有 意思 ， 因 为 其 本 身 就 是 螺旋 式 演 化 的 一 个 例子 。Mac 
操作 系统 最 初 就 已 提供 但 在 Palm 操作 系统 部 分 未 予 讨论 的 唯一 特征 是 ，Mac 
操作 系统 的 图 形 化 用 户 界 面 支持 重 登 窗口 。 其 仍然 是 单 用 户 系 统 和 平坦 型 文件 
系统 ， 就 像 CP/M 和 Palm 操作 系统 一 样 。 然 而 ， 伴 随 Mac 操作 系统 的 升级 演 
化 ， 革 果 公 司 (Apple) 又 为 其 增加 了 许多 新 的 功能 ， 如 多 任务 、 多 级 文件 系统 
( Hierarchical File System，HFS ， 或 称 为 分 层 式 文件 系统 )、 多 用 户 (尽管 不 是 同 
时 /并 发 支持 )、 多 处 理 器 以 及 虚拟 存储 系统 。 这 些 机 制 将 逐一 依次 展开 讨论 ， 且 
由 最 后 的 虚拟 内 存 主题 自然 而 然 地 引出 下 一 章 的 内 容 。 

第 6 章 涵 盖 了 Linux， 以 作为 适应 从 谈 入 式 系 统 到 实时 系统 再 到 超级 计算 机 
等 许多 不 同 硬件 平台 的 操作 系统 的 实例 。 在 这 里 ，Linux 与 前 述 系统 的 主要 区 别 
是 ， 它 是 基于 在 多 个 终端 上 的 多 个 用 户 的 假设 前 提 而 设计 的 。 为 了 支持 相关 功 
能 ， 操 作 系 统 内 部 〈 特 别 是 在 文件 系统 中 ) 必须 提供 更 多 的 保护 机 制 。Linux 也 是 
开源 操作 系统 的 一 个 例子 ， 这 项 不 同 在 本 章 中 也 会 有 所 探讨 。 在 本 书后 面 的 部 分 
将 会 就 Linux 展开 进一步 更 详细 的 介绍 。 

第 7 章 就 跨越 多 个 计算 机 系统 的 操作 系统 的 设计 所 引发 的 问题 进行 了 探讨 。 
通常 ， 此 类 系统 会 跨越 行政 管理 领域 。 几 乎 可 以 肯定 地 说 ， 所 涉 机 构 的 政策 和 利 
益 往 往 并 不 一 样 。 事 实 上 ， 彼 此 间 甚 至 可 能 相互 冲突 。 尽 管 如 此 ， 有 关机 构 还 是 
找到 了 某 些 共同 的 利益 ， 从 而 驱使 他 们 建立 起 了 跨越 此 类 界限 的 系统 。 本 章 将 通 
过 GLOBUS 来 具体 盖 述 有 关 的 问题 。 当 然 ， 也 会 讨论 其 他 的 一 些 系统 。 
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简单 的 单 进程 操作 系统 





现在 ,我 们 开始 本 书 的 “螺旋 式 ” 部 分 ,每 一 章 将 基于 一 个 特定 的 真实 的 操作 系统 来 
讨论 一 种 类 型 的 操作 系统 。 我 们 从 一 种 真实 但 简单 的 功能 有 限 的 操作 系统 出 发 ， 并 会 在 后 续 
的 章节 中 渐进 式 地 讨论 更 为 复杂 的 操作 系统 。 我 们 将 立足 于 一 种 早期 的 个 人 计算 机 操作 系统 
( 即 CP/M) 的 功能 及 经 常用 于 运行 该 系统 的 硬件 来 陈述 本 章 的 大 部 分 内 容 。 我 们 讨论 了 这 些 
操作 系统 是 如 何 设计 的 ， 以 及 设计 背后 的 基本 原理 。 虽 然 这 些 系统 是 仅 支 持 单 进程 且 功 能 有 
限 的 系统 ， 但 它们 为 在 数 以 百 万 台 的 个 人 计算 机 上 编写 的 成 百 上 千 个 应 用 程序 提供 了 充足 的 
动力 。 因 而 ， 它 们 提供 了 简单 操作 系统 的 一 个 很 好 的 实例 。 在 这 一 章 中 所 讨论 的 问题 ， 如 输 
入 /输出 管理 、 文 件 系 统 、 内 存 和 进程 管理 ， 将 在 后 续 的 章节 中 伴随 更 复杂 操作 系统 的 引入 
逐渐 展开 进一步 的 详细 介绍 。 尽 管 如 此 ， 我 们 在 这 里 先 夯实 一 个 基础 : 真实 但 简单 的 功能 。 

本 章 组 织 如 下 : 第 3.1 节 介绍 了 简单 操作 系统 的 前 身 ， 即 所 谓 的 监控 程序 ， 并 讨论 了 它 
们 是 如 何 因应 标准 化 的 需要 而 演变 成 早期 的 操作 系统 的 。 在 第 3.2 节 中 ， 我 们 描述 了 这 种 类 
型 的 操作 系统 所 使 用 的 早期 个 人 计算 机 系统 的 特征 。 然 后 ,我 们 在 第 3.3 节 中 ,讨论 了 输入 / 输 
出 在 这 样 一 个 早期 的 操作 系统 里 是 如 何 进行 管理 的 。 接 下 来 ， 我 们 分 别 在 第 3.4 节 和 第 3.5 
节 中 给 出 了 文件 系统 及 进程 和 内 存 管 理 的 描述 。 

当时 的 系统 局 限 性 很 大 ， 它 们 一 次 只 运行 一 个 用 户 程序 。 进 程 管理 最 初 仅 限于 加 载 和 启 
动 一 个 特定 的 应 用 程序 。 后 来 的 新 版 CP/M 增加 了 后 台 打 印 功 能 。 这 套 机 制 是 多 处 理 概念 的 
开端 ， 后 者 在 更 现代 的 操作 系统 中 得 到 了 贯彻 实施 。 操 作 系统 中 的 内 存 管 理 仅 限于 确认 和 处 
理 哪 一 部 分 的 内 存 用 于 存放 操作 系统 、 中 断 向 量 、 用 户 程序 或 是 程序 数据 ， 等 等 。 但 是 ,由 
于 内 存 非常 有 限 ， 大 型 程序 往往 无 法 完全 加 载 到 内 存 中 ， 或 者 在 它们 可 以 处 理 的 数据 量 方面 
存在 着 极 大 的 局 限 性 。 为 此 ， 应 用 程序 员 就 不 得 不 把 这 样 的 程序 分 解 成 若干 部 分 ， 并 根据 需 
要 用 其 另 一 部 分 来 替换 内 存 中 的 部 分 。 这 项 内 存 管 理 技术 ， 称 为 覆盖 ( overlay)， 将 在 第 3.5 
节 中 讨论 。 此 外 ， 这 些 技术 还 预示 着 在 现代 操作 系统 中 能 够 找到 的 更 复杂 的 内 存 管理 技术 。 


3.1 监控 程序 和 CP/M 


我 们 从 关于 “为 什么 出 现 了 构建 个 人 计算 机 操作 系统 的 需要 ? ”的 讨论 出 发 ， 来 开启 本 闻 
的 内 容 。 这 些 操作 系统 的 前 身 被 称 为 监控 程序 ? ， 其 功能 非常 有 限 。 监 控 程 序 没有 任何 可 以 遵 
循 的 标准 一 一 早期 个 人 计算 机 系统 的 制造 商 经 常 各 自 编写 自己 的 监控 程序 ， 且 采用 的 是 独自 特 
有 的 命令 和 编程 惯例 。 这 种 多 样 性 意味 着 ,早期 的 应 用 程序 必须 得 为 每 个 监控 程序 重 写 代 码 。 


3.1.1 监控 程序 : 简单 操作 系统 的 前 身 
当 个 人 计算 朝气 蓬勃 向 前 发 展 且 单 芯片 微 处 理 器 使 小 型 且 相 对 便宜 的 计算 机 的 构建 成 为 
可 能 的 时 候 ， 软 件 危 机 发 生 了 。 廉 价 的 微 处 理 器 的 出 现 催生 了 小 型 初创 公司 ， 这 些 公司 把 配 


日 ”我 们 正 谈论 的 是 作为 操作 系统 前 身 的 一 种 软件 模块 ， 而 不 是 视频 显示 终端 ， 后 者 有 时 也 称 作 “ monitor” 
( 即 监视 器 ) 且 经 常用 在 计算 机 上 。 
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套 元 件 卖 给 了 本 地 的 那些 想 要 搭建 自己 计算 机 的 爱好 者 。 相 关 组 件 通 常 包 含 一 个 电路 板 、 一 
个 微 处 理 器 、 一 些 内 存 以 及 一 些 扩充 的 设备 控制 器 芯片 。 这 些 扩充 芯片 用 于 控制 各 种 输入 和 
输出 设备 ， 璧 如 盒 式 磁 带 、 软 盘 、 外 接 的 视频 终端 以 及 打印 机 。 许 多 公司 都 在 销售 个 人 计算 
机 元 器 件 。 不 过 ， 无 论 以 何 种 标准 来 说 ， 一 开始 他 们 都 具有 极 大 的 局 限 性 。 在 早期 的 这 类 系 
统 中 ， 内 存 大 小 也 就 1KB~4KB， 有 时 甚至 更 少 。 应 用 程序 是 用 机 器 语言 或 汇编 语言 编写 
的 。 一 般 情 况 下 并 没有 操作 系统 。 不 过 ,倒是 有 一 个 不 大 的 监控 程序 ( monitor program) 通 
常 存放 在 只 读 存 储 器 ( Read-Only Memory，ROM) 中 ， 可 以 支持 应 用 程序 完成 一 些 简 单 的 、 
共性 的 任务 ， 例 如 : 

。 输出 字符 到 视频 显示 器 或 电 传 打字 机 等 设备 上 。 

e 从 键盘 设备 获取 字符 。 

e 把 内 存 的 全 部 或 部 分 内 容 保存 到 盒 式 磁带 或 软盘 上 。 

。 用 磁带 或 磁盘 上 存放 的 镜像 对 内 存 内 容 进行 恢复 。 

e 打印 字符 到 打印 机 上 。 

监控 程序 只 能 完成 这 些 基本 的 任务 ， 除 此 之 外 ， 没 有 什么 其 他 的 功能 。 

应 用 程序 可 以 通过 以 下 步骤 调用 监控 程序 ， 从 而 把 字符 (如 一 个 “1”) 显示 到 控制 台 
(console) 的 视频 显示 器 或 电 传 打字 机 上 。 

1 ) 把 字符 放 入 监控 程序 指定 的 特定 寄存 器 中 (假设 为 寄存 器 EE)。 在 本 例 中 ， 十 六 进 制 
数值 “31”( 即 字符 “1” 的 ASCII 码 ) 被 存 人 寄存 器 卫 中 。 

2 ) 选择 特定 的 监控 程序 函数 (本 例 中 ,“ 显 示 字 符 ” 的 函数 对 应 数值 为 “2”)， 并 把 所 
选 监控 程序 函数 对 应 的 数 存 人 寄存 器 C 中 。 

3 ) 最 后 ， 通 过 5 号 中 断 执行 对 监控 程序 的 调用 。 这 将 会 使 监控 程序 按照 存放 在 寄存 器 
C 的 函数 编码 和 存放 在 寄存 器 卫 的 字符 来 执行 所 调用 的 显示 函数 。 

4 ) 监控 程序 输出 该 字符 后 ,会 返回 一 个 表示 正确 ( OK) 或 不 正确 (not OK) 的 状态 码 
放 在 寄存 器 A 中 。 不 正确 的 话 ， 还 会 说 明 发 生 了 什么 异常 情况 ， 如 设备 不 响应 或 传人 函数 
的 某 些 参数 值 非法 等 。 按 理 说 ， 应 用 程序 须 检 查 寄 存 器 A 中 的 状态 码 ， 以 确定 因应 特定 错 
误 的 适当 动作 。 不 过 ， 典 型 的 早期 应 用 程序 并 不 总 是 进行 错误 检查 ， 因 为 对 于 大 多 数 的 错误 
来 讲 ， 它 们 几乎 没有 什么 可 做 的 事情 。 


3.1.2 为 什么 创建 CP/M ? 什么 是 软件 危 


许多 公司 都 在 组 装 和 搭建 计算 机 ， 且 每 家 公司 均 须 提供 用 作 小 型 监控 程序 的 一 套 软件 。 
从 内 存 需 求 角度 而 言 ， 这 些 监 控 程序 并 不 算 大 ， 也 就 几 百 或 几 千 字 节 。 通 常情 况 下 ， 一 个 监 
控 程 序 仅 提供 十 几 项 功能 ,但 这 些 功 能 需要 时 间 和 专业 技能 来 开发 、 调 试 和 构建 。 更 为 糟糕 
的 是 ， 没 有 一 个 标准 的 监控 程序 或 监控 程序 接口 。 每 家 制造 厂商 都 只 是 简单 地 实现 了 他 们 想 
象 中 的 程序 员 们 想 要 的 功能 。 例 如 ， 在 一 个 监控 程序 中 可 能 采用 寄存 器 把 参数 传递 到 函数 
中 ， 而 在 另 一 个 监控 程序 中 则 可 能 采用 内 存单 元 来 传递 参数 ， 但 在 第 三 个 监控 程序 中 还 可 能 
混合 使 用 上 述 两 种 方法 。 这 便 给 应 用 程序 设计 编写 带 来 了 一 个 问题 。 如 何 才能 编写 出 具有 可 
移植 性 (portable) 的 程序 呢 ? 也 就 是 说 ， 如 何 才能 让 写 出 的 程序 可 以 运行 在 不 同 制造 商 的 计 
算 机 上 呢 8? 由 于 监控 程序 的 不 同 ， 所 以 对 于 每 一 家 制造 商 的 计算 机 ， 即 便 是 同样 的 应 用 程 


名 因为 早期 的 应 用 程序 都 是 用 机 器 语言 编写 的 ， 所 以 这 里 的 应 用 程序 可 移植 性 要 求 计算 机 所 用 处 理 器 必须 
相同 或 至 少 兼容 ， 也 就 是 说 ， 一 种 处 理 器 的 指令 集 必须 是 男 一 种 处 理 器 的 指令 集 的 超 集 。 
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序 也 需要 分 别 专门 编写 。 这 种 状况 诱发 了 CP/M ( Control Program/Monitor， 控 制程 序 / 监控 
者 ) 的 研发 。 该 系统 是 基于 英特尔 8080/8085 (Intel 8080/8085 ) 处 理 器 电路 的 微型 计算 机 创 
建 的 ， 且 CP/M 最 初 是 数字 研究 公司 的 Gary Kildall 一 个 人 的 成 果 。 


3.1.3 CP/M 的 构成 


CP/M 系统 允许 软件 开发 人 员 、 用 户 和 制造 商 拥 有 一 个 唯一 简单 的 标准 接口 。 其 通过 利 
用 基本 输入 /输出 系统 (Basic Input/Output System，BIOS) 软件 层 ， 把 硬件 设备 同 操作 系统 
进行 了 隔离 。 该 BIOS 和 监控 程序 有 些 类 似 ， 但 具有 标准 化 的 功能 和 接口 。 每 家 制造 商 可 以 
调整 BIOS 来 支持 和 适应 他 们 的 特定 机 器 所 包含 的 所 有 设备 9S。 但 是 ， 不 管 底层 的 设备 是 如 
何 工作 的 ，BIOS 的 接口 却 是 相同 的 。 这 样 ， 要 把 CP/M 移植 到 一 个 新 的 系统 上 ， 主 要 的 工 
作 就 是 根据 硬件 重 写 BIOS 的 相关 例 程 。 

操作 系统 核心 称 作 基 本 磁盘 操作 系统 (Basic Disk Operating System，BDOS )， 这 就 是 我 
们 今天 所 说 的 内 核 。 其 与 硬件 无 关 ， 并 调用 了 BIOS 中 的 更 原始 的 服务 。 对 于 CP/M 运行 的 
任何 系统 平台 来 说 ，BDOS 都 是 一 样 的 。 这 种 提供 了 通用 系统 函数 和 隐藏 了 繁琐 硬件 细节 的 
标准 化 接口 称 作 抽象 (abstraction ) 。 在 本 书 中 ， 我 们 会 多 次 提 到 抽象 技术 。 

操作 系统 的 最 后 一 部 分 是 称 作 控 制 台 命令 处 理 程 序 ( Console Command Processor，CCP) 
的 操作 系统 用 户 接口 。CCP 执行 的 其 他 命令 大 部 分 是 磁盘 上 的 程序 。CP/M 操作 系统 的 这 三 
部 分 都 很 小 。 每 部 分 的 大 小 也 就 2000 一 4000 字 节 ， 整 个 CP/M 都 存放 在 软盘 的 几 个 扇 区 上 
以 便 启动 计算 机 。 

CP/M 实际 标准 的 存在 激励 着 软件 编写 人 员 为 各 种 各 样 的 制造 商 构建 的 个 人 计算 机 开发 
应 用 软件 。 相 关 软 件 能 够 支持 许 许多 多 的 输入 /输出 设备 ， 壁 如 不 同 容量 的 软盘 、 硬 盘 以 及 
视频 终端 。 应 用 程序 无 须 再 为 每 种 类 型 的 计算 机 定制 式 专门 编写 。 很 短 的 时 间 内 就 可 以 编写 
完成 数 百 个 程序 。 对 于 程序 员 来 说 ， 有 文本 编辑 器 、 各 种 编程 语言 的 编译 器 以 及 调试 工具 。 
字 人 处理 程序 、 会 计 软 件 包 、 简 单 文件 系统 、 游 戏 以 及 许多 其 他 程序 的 编写 还 催生 了 莲 撮 发 展 
的 个 人 计算 机 市 场 。 由 于 操作 系统 设计 得 很 好 ， 在 每 一 层 都 有 一 个 清晰 标定 的 接口 ， 所 以 还 
出 现 了 控制 台 命 令 处 理 程序 CCP 的 若干 替代 程序 可 以 方便 提供 不 同 的 接口 。 

当 IBM 决心 进入 个 人 计算 机 市 场 ， 最 初 的 决定 是 采用 行 之 有 效 的 CP/M 标准 。 由 于 
IBM 个 人 计算 机 ( Intel 8088 ) 的 处 理 器 与 CP/M-80 并 不 完全 兼容 一 一 它们 分 别 基于 Intel 
8080 处 理 器 和 Zilog ( 译 者 注 : 美国 齐 格 洛 公司 ， 著 名 的 Z80 系列 处 理 器 的 设计 者 ) Z-80 处 
理 咒 一 一 所 以 ， 进 行 了 一 些小 的 改动 。IBM 的 硬件 非常 出 名 且 很 有 特点 ， 所 以 BIOS 可 以 充 
分 利用 相关 特征 9。 

在 随后 的 几 节 ， 我 们 对 早期 的 IBM 个 人 计算 机 和 CP/M 计算 机 的 硬件 进行 了 大 胆 地 
概括 。 我 们 的 目的 不 是 讲授 CPIM， 而 是 以 它 作 为 一 个 例子 来 说 明 简 单 操作 系统 的 特征 和 
功能 。 


3.2 简单 的 个 人 计算 机 系统 的 特征 
早期 的 个 人 计算 机 系统 包括 一 块 主 电路 板 ， 即 个 人 计算 机 的 主板 (motherboard)。 这 块 
、 也 可 能 是 由 电脑 爱好 者 自己 来 完成 相关 适应 性 调整 的 ， 因 为 伴随 有 关 软件 还 有 指令 集 和 示例 。 而且， 其 


至 像 增加 系统 内 存 等 比较 简单 的 一 些 事情 也 要 求 重 新 创建 基本 输入 /输出 系统 。 
日 最 后 ，IBM 采纳 了 微软 开发 的 MS/DOS 操作 系统 用 在 他 们 的 个 人 计算 机 上 。 
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主板 有 一 个 微 处 理 器 芯片 (CPU)、 一 些 随 机 访问 存储 器 ( Random Access Memory，RAM， 
或 称 为 随机 存 取 存 储 器 )、 包 含 基本 输入 /输出 系统 (BIOS) 的 只 读 存储 器 (ROM) 以 及 把 这 

些 芯片 连接 到 一 起 的 若干 其 他 集成 电路 ( Integrated Circuit，IC ) 。 主 板 还 有 一 些 捅 槽 ， 用 于 
插入 外 加 的 扩展 电路 板 (在 早期 的 个 人 计算 机 术语 中 称 为 插 卡 ， 即 card)。 这 些 扩展 卡 中 包 
括 一 个 视频 控制 器 ， 通 过 将 显示 器 电缆 插入 视频 控制 卡 中 就 可 以 连接 到 一 台 视 频 监 视 器 上 。 
其 他 扩展 卡 包括 追加 的 内 存 条 以 及 软盘 控制 器 和 硬盘 控制 器。 用 户 输 入 /输出 经 由 视频 监视 
器 和 键盘 来 完成 。 键 盘 是 直接 插 到 主板 上 的 ， 主 板 有 一 个 内 置 的 键盘 控制 器 芯片 。 另 外 ， 主 
板 上 还 有 一 个 简单 的 时 钟 或 定时 需 芯 片 。 

关于 早期 个 人 计算 机 系统 典型 硬件 组 成 的 简单 系统 示意 图 如 图 3-1 所 示 。 就 这 类 系统 而 
言 ， 其 对 操作 系统 设计 有 重大 影响 的 一 些 特征 如 下 : 

1 ) 主 存 大 小 相当 有 限 。 这 导致 了 一 次 仅 加 载 一 道 应 用 程序 进入 内 存 的 操作 系统 设计 决 
策 。 因 为 CP/M 操作 系统 非常 小 ， 所 以 其 常 驻 内 存 ， 上 有 具体 包括 装 入 程序 、 中 断 处 理 程序 和 设 
备 驱 动 程序 。 如 果 剩 余 的 可 用 内 存 无 法 容纳 和 放下 一 道 应 用 程序 ， 则 该 应 用 程序 将 不 得 不 被 
划分 和 写成 若干 可 以 分 别 单独 放 入 内 存 的 节 。 当 需要 新 的 一 节 时 ， 应 用 程序 可 基于 所 谓 覆 盖 
(overlay) 的 内 存 管理 技术 用 新 的 一 节 把 旧 的 一 节 替 换 掉 。 

2 ) 磁盘 格式 是 标准 化 的 。 早 期 个 人 计算 机 的 软盘 和 硬盘 的 盘 块 大 小 及 格式 是 固定 不 变 
的 。 这 导致 了 基于 标准 磁盘 格式 的 标准 化 文件 系统 的 设计 。 

3 ) 中 断 处 理 主 要 针对 输入 / 输出 设备 。 既 然 每 次 只 能 运行 一 道 应 用 程序 ， 所 以 没有 必 
要 在 应 用 程序 间 进 行 切换 。 操 作 系统 中 无 须 处 理 器 调度 。 主 要 的 中 断 类 型 均 用 于 处 理 输入 / 
输出 设备 。 





图 3-1 早期 个 人 计算 机 系统 的 硬件 组 成 


3.3 ”输入 /输出 管理 


相对 于 如 今 的 各 种 各 样 的 设备 来 说 ， 当 时 的 输入 /输出 设备 类 型 很 少 ， 所 以 早期 操作 系 
统 中 的 输入 /输出 处 理 功 能 非常 有 限 。 早 期 个 人 计算 机 的 大 多 数 应 用 程序 一 般 需要 如 下 输入 / 
输出 服务 : 

1 ) 从 键盘 读 取 字 符 。 

2 ) 写 出 字符 到 显示 器 屏幕 上 。 
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3 ) 打印 字符 到 打印 机 上 。 

4 ) 利用 磁盘 文件 系统 创建 一 个 新 文件 、 读 / 写 文件 以 及 关闭 文件 。 

许多 程序 面临 的 一 个 问题 是 ， 在 处 理 键 盘 输入 和 屏幕 输出 方面 缺乏 灵活 性 。 因 为 有 许多 
不 同 的 公司 都 在 制造 工作 方式 各 不 相同 的 计算 机 硬件 ， 所 以 操作 系统 试图 提供 一 种 标准 的 方 
式 来 处 理 这 些 差异 。 

另外 一 个 问题 是 性 能 。 具 体 而 言 ， 直 接 调 用 BIOS 或 硬件 来 执行 输入 /输出 指令 往往 比 
调用 适当 的 操作 系统 命令 要 更 快 和 更 灵活 。 于 是 ， 便 产生 了 可 移植 性 (portability) 和 灵活 性 
及 更 快速 度 的 折 中 问题 。 如 果 应 用 程序 设计 人 员 仅 仅 使 用 操作 系统 调用 来 执行 输入 /输出 ， 
则 会 更 好 地 满足 可 移植 性 。 而 如 果 应 用 程序 设计 人 员 直 接 调用 BIOS 和 硬件 功能 ， 则 可 能 获 
得 更 好 的 灵活 性 及 更 快 的 速度 。 作 为 示例 ， 我 们 围绕 早期 系统 中 两 个 最 常见 的 输入 /输出 设 
备 ， 即 用 作 输 入 设备 的 键盘 和 用 作 输 出 设备 的 视频 监视 器 ， 讨 论 了 有 关 折 中 问题 。 


3.3.1 键盘 输入 一 一 可 移植 性 与 灵活 性 


有 许多 类 型 的 键盘 。 它 们 可 能 有 65 一 95 个 键 ， 且 在 键盘 上 摆 放 的 位 置 也 不 尽 相 同 。 从 
键盘 传输 的 数据 可 能 是 串 行 的 ， 也 可 能 是 并 行 的 ， 而 字符 则 可 能 表示 为 7 位 或 者 8 位 。 这 如 
何 才能 标准 化 呢 ? BIOS 是 针对 每 种 类 型 的 键盘 而 分 别 定制 的 ， 但 会 为 操作 系统 的 其 余部 分 
提供 相同 的 BIOS 接口 函数 集合 。 于 是 ，BDOS 可 使 用 BIOS 的 那些 函数 来 为 键盘 创建 一 个 
简单 的 操作 系统 接口 。 关 于 键盘 的 这 些 函 数 ( 即 操作 系统 的 系统 调用 ) 是 : 1 ) 从 键盘 上 读 
取 一 个 字符 ; 2 ) 检查 是 否 有 一 个 按键 被 按 下 。 对 于 许多 应 用 程序 来 说 ， 这 已 经 足够 了 。 同 
时 ,如果 一 个 应 用 程序 就 其 键盘 输入 使 用 了 这 些 标准 函数 ， 其 便 可 以 移植 到 任何 计算 机 系 
统 上 。 

但 是 ， 有 些 应 用 程序 需要 额外 的 灵活 性 。 例 如 ， 字 处 理 程序 可 能 想 要 使 用 “修正 后 的 ” 
按键 ， 具体 而 言 ， 用 “ Control+S” 来 保存 文件 ， 用 “ Control+C” 来 弹出 一 个 命令 列表 菜 
单 。 这 些 特殊 的 按键 或 按键 组 合 产生 了 一 个 问题 ， 因 为 它们 没有 受到 BDOS 的 认可 ， 因 而 
无 法 传递 给 应 用 程序 。 更 为 糟糕 的 是 ， 一些 按 键 组 合 ， 如 “Controlt+C” 可 能 已 被 BIOS 或 
BDOS 进行 了 解读 ， 并 可 能 导致 诸如 操作 系统 重启 之 类 的 动作 。 在 这 种 情况 下 ， 显 然 无 法 把 
按键 组 合 传递 给 应 用 程序 。 

想 要 额外 灵活 性 来 处 理 键盘 的 应 用 程序 (因而 按键 组 合 对 该 应 用 程序 来 说 是 有 特定 意义 
的 ) 绕 开 了 BDOS。 这 一 点 微不足道 。 这 可 能 意味 着 将 是 从 BIOS 而 非 BDOS 读 取 按键 ， 甚 
至 可 能 从 键盘 硬件 (实际 上 是 键盘 接口 芯片 ) 直接 读 取 按键 。 因 为 在 早期 的 系统 里 没有 内 存 
保护 ， 所 以 绕 过 操作 系统 (BDOS) 非常 容易 。 任 何 应 用 程序 都 可 以 寻 址 内 存 的 任何 部 分 。 
使 用 BIOS 调用 就 像 使 用 BDOS 调用 一 样 简 单 ， 只 不 过 基本 磁盘 操作 系统 BDOS 调用 不 会 
按 应 用 程序 所 需 的 方式 来 行事 而 已 。 这 种 方法 的 问题 是 ， 程 序 将 不 再 是 可 移植 的 ， 尤 其 是 在 
应 用 程序 直接 调用 到 硬件 的 情况 下 。 


3.3.2 ”视频 监视 器 输出 一 一 可 移植 性 及 功能 与 性 能 


屏幕 或 视频 监视 器 带 来 了 更 为 严重 的 问题 。 首 先 ， 通 过 BDOS 及 BIOS 的 接口 函数 提供 
的 功能 非常 有 限 。 视 频 系 统 的 许多 功能 无 法 直接 通过 简单 的 操作 系统 调用 来 使 用 。 例 如 ， 人 
们 不 能 使 用 颜色 、 写 人 多 个 视频 内 存 “ 页 面 ”进而 通过 快速 显示 一 系列 图 像 来 模拟 运动 ， 也 
不 能 把 光标 移动 同 写 屏幕 独立 开 来 。 其 次 ， 甚 至 更 为 严重 的 是 ， 使 用 BDOS 的 屏幕 输出 非 
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常 缓慢 。 许 多 应 用 程序 更 倾向 于 把 字符 直接 写 到 屏幕 内 存 和 直接 访问 视频 控制 器 硬件 。 也 有 
许多 应 用 程序 使 用 BIOS 调用 来 移动 光标 。 它 们 绕 过 BDOS 的 主要 原因 是 为 了 提高 应 用 程序 
的 性 能 。 

直接 写 人 视频 内 存 不 仅 提供 了 更 多 的 功能 ， 而 且 也 比 通过 操作 系统 系统 调用 要 快 了 许 
多 。 根据 所 采用 的 编程 语言 ， 它 能 够 快 出 100 倍 甚至 更 多 ! 绕 过 操作 系统 来 显示 字符 造成 了 
与 绕 过 键盘 所 导致 的 相同 类 型 的 可 移植 性 问题 。 然 而 ， 性 能 方面 的 优势 是 如 此 显著 ， 所 以 使 
许多 应 用 程序 忽略 了 可 移植 性 来 提高 性 能 。 这 对 于 游戏 类 程序 而 言 尤 其 如 此 ， 它 们 总 是 试图 
从 硬件 里 榨取 任何 可 能 的 哪怕 是 一 丁点 的 性 能 。 游 戏 总 是 推动 着 个 人 计算 机 硬件 的 迅猛 发 展 
和 不 断 进 步 。 

例如 ， 把 一 个 白色 的 字符 “+” 写 到 黑色 的 屏幕 背景 中 仅 需 要 调用 一 条 单一 的 机 器 指令 : 
“Move 0F800，2B07”。 直 接 把 文本 写 到 视频 内 存 是 相对 直接 和 简单 的 。 视 频 内 存 从 十 六 进 
制 地 址 0F800 开始 ， 其 对 应 屏幕 左上 角 的 第 一 个 可 见 字 符 。 紧 随地 址 后 面 的 是 对 应 字符 的 视 
频 属 性 (video attribute)。 对 于 彩色 适配器 而 言 ， 其 是 一 个 8 个 二 进 制 位 的 信息 : 3 位 用 于 表 
示 前 景 颜色 信息 9S, 3 位 用 于 表示 背景 颜色 信息 , 1 位 用 于 指示 是 否 为 “高 强度 前 景 "( 即 高 亮 )， 
剩 下 的 1 位 用 于 指示 字符 是 否 闪 烁 。 为 此 ， 字 符 “+”( 对 应 ASCII 码 为 “2B”) 写 到 屏幕 左 
上 和 角 位 置 (对 应 视频 内 存 地 址 F800 )， 同 时 设置 前 景 为 白色 (“7”)、 背 景 为 黑色 (“0"” )。 在 
白色 背景 上 的 一 个 黑色 字符 ， 其 视频 属性 可 简单 地 设置 为 “70”。 


3.4 磁盘 管理 和 文件 系统 


既然 有 如 此 之 多 的 应 用 程序 绕 过 了 关于 键盘 和 视频 的 操作 系统 系统 调用 ， 那 么 操作 
系统 真正 提供 了 哪些 功能 呢 ? 此 类 早期 操作 系统 提供 的 一 项 主要 服务 是 标准 的 可 移植 的 
文件 系统 ， 即 实现 磁盘 管理 的 基本 功能 。 大 约 75% 的 操作 系统 系统 调用 是 与 磁盘 文件 相 
关 的 。 在 这 一 节 ， 我 们 讨论 CP/M 的 文件 系统 ， 但 将 首先 阐述 作为 文件 系统 基础 的 磁盘 
系统 。 


3.4.1 磁盘 系统 


早期 的 个 人 计算 机 系统 ， 有 一 套 硬件 磁盘 设备 ( 即 8 英寸 软盘 ) 的 标准 与 文件 系统 一 起 
被 使 用 ， 如 图 3-2 所 示 。 该 软盘 在 中 间 有 一 个 孔 ， 软 盘 驱 动 器 通过 这 个 孔 把 软盘 放置 在 一 个 
主轴 上 。 主 轴 连 接 到 一 个 磁盘 驱动 器 马达 上 ， 后 者 将 按 每 分 钟 360 转 的 速度 转动 磁盘 。 标 准 
磁盘 拥有 77 条 磁道 (track)， 编 号 从 距离 中 心 孔 最 远 外 圈 的 0 号 磁道 一 直到 最 里 面 的 76 号 
磁道 。 磁 道 是 同心 圆 ， 也 就 是 说 每 条 磁道 从 开始 一 直到 结束 与 中 心 孔 之 间 都 是 等 距离 的 。 一 
条 磁道 包含 26 个 扇 区 (sector， 有 时 称 为 块 ， 即 block)， 第 一 个 肩 区 编号 为 1， 最 后 一 个 记 
区 编号 26 8。 每 个 扇 区 包含 128 字 节 的 数据 ， 另 加 一 些 控制 信息 ， 璧 如 扇 区 编号 。 软 盘 是 
双 面 的 ， 不 足 为 奇 ， 两 面 的 编号 分 别 为 0 和 1。 在 中 心 孔 附近 ， 有 一 个 称 为 指示 孔 (index 
hole) 的 小 孔 ， 可 被 磁盘 控制 器 用 来 确定 各 磁道 的 第 一 个 扇 区 。 所 有 的 磁道 都 有 26 个 刷 区 ， 
外 圈 的 磁道 较 长 而 内 圈 的 磁道 较 短 ， 但 每 条 磁道 均 存放 有 相同 数量 的 数据 @。 


日 ”颜色 采用 每 位 分 别 指示 红 、 绿 、 蓝 的 方式 来 表示 ; 于 是 白色 表示 为 所 有 3 位 均 为 1 ( 译 者 注 : 即 二 进 制 数 


“111”， 对 应 十 进 制 数 为 7 ) 的 情形 。 
日 ”注意 ; 磁道 编号 从 0 开始 ， 扇 区 编号 从 1 开始 。 
四 这 对 于 现代 硬盘 而 言 不 再 成 立 了 。 


甸 了 个 ”前 剖 的 学 进程 所 作 系 统 4 和 





0 号 磁道 
图 3-2 早期 个 人 计算 机 的 软盘 


磁盘 系统 是 由 磁盘 驱动 器 (disk drive) 和 磁盘 控制 器 ( disk controller) 组 成 的 。 磁 盘 驱 
动 器 固定 和 旋转 真正 包含 所 存储 数据 的 磁盘 介质 (软盘 )。 磁 盘 控 制 器 则 往往 建造 在 计算 机 
主板 上 或 一 块 插入 主板 的 电路 卡 上 。 磁 盘 驱动 器 可 以 在 磁道 之 间 移 动 磁头 (disk head)， 磁 头 
中 包含 有 读 / 写 的 磁 传 感 器 。 要 在 磁道 上 读 取 任何 单个 扇 区 ， 磁 盘 驱动 器 必须 等 待 该 鹿 区 旋 
转 到 磁头 下 。 

磁盘 控制 器 可 以 接受 在 磁盘 的 指定 面 和 指定 轨道 上 读 取 或 写 人 一 个 扇 区 或 多 个 扇 区 的 命 
令 。 磁 盘 驱 动 器 的 磁头 移动 马达 移动 磁头 ， 有 时 可 能 会 错过 指定 的 磁道 (而 到 了 错误 的 磁道 
上 )。 磁 盘 控 制 器 会 检查 到 这 类 事件 (每 条 磁道 的 每 个 扇 区 上 都 有 对 应 的 磁道 号 )， 并 正确 地 
重新 定位 磁头 。 有 时 扇 区 也 可 能 会 被 错误 地 读 取 ， 同 样 ， 磁 盘 控 制 器 会 检查 出 此 类 事件 ， 并 
尝试 再 次 读 取 。 磁 盘 控 制 器 在 指示 和 孔 旋转 错误 后 ， 也 会 启动 寻找 磁道 开始 扇 区 以 重新 定位 自 
身 。 所 有 这 些 活 动 对 于 操作 系统 甚至 BIOS 都 是 不 可 见 的 。 它 们 或 者 在 磁盘 控制 器 本 身 的 硬 
件 级 别 上 实现 ， 或 者 在 控制 “磁盘 控制 器 上 的 专用 处 理 器 ”的 软件 中 实现 。 这 种 嵌入 在 控制 
右上 ROM 中 的 软件 通常 被 称 为 固件 (firmware)。 

早期 个 人 计算 机 系统 的 此 类 标准 磁盘 ， 在 用 操作 系统 格式 化 之 后 ， 可 以 存放 : 77 ( 磁 
道 / 面 ) *26 ( 扇 区 /磁道 ) *128 ( 字 节 / 扇 区 ) *2 ( 面 ) =512 512 字 节 的 原始 数据 ( 约 为 
500KB ) 。 磁 盘 格式 化 (disk formatting) 就 是 把 控制 信息 写 到 磁盘 和 把 磁道 划分 为 扇 区 的 过 
程 。 这 种 标准 盘 被 用 于 作为 实现 个 人 计算 机 的 操作 系统 之 文件 系统 的 基础 ， 下 一 小 节 我 们 将 
讨论 文件 系统 。 


3.4.2 文件 系统 


这 个 操作 系统 有 一 个 建立 在 BIOS 之 上 的 简单 的 文件 系统 ， 用 于 存放 用 户 文件 和 系统 文 
件 。 可 存放 在 磁盘 上 的 系统 文件 部 分 包含 二 进 制 的 操作 系统 代码 本 身 。 此 外 ,. 每 个 磁盘 设立 
有 一 个 目录 存放 了 存储 在 该 磁盘 上 的 所 有 文件 的 相关 信息 ， 包 括 它 们 的 大 小 、 物 理 磁 盘 上 存 
储 位 置 〈 扇 区 )， 等 等 。 存 储 在 磁盘 上 的 文件 可 能 包含 如 下 类 型 的 数据 : 

e 应 用 程序 生成 的 数据 (文档 、 数 据 表 、 源 代码 )。 

e 应 用 程序 可 执行 文件 (二进制 代码 )。 

e 目录 信息 (文件 名 、 创 建 日 期 、 在 磁盘 上 的 存储 位 置 )。 

。 操作 系统 的 二 进 制 可 执行 文件 (操作 系统 可 执行 文件 ， 用 于 加 载 或 “引导 ”操作 系统 )。 

为 了 适应 和 容纳 存储 在 磁盘 上 的 各 种 不 同类 型 的 信息 ， 就 BIOS 而 言 ， 每 个 物理 磁盘 被 
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划分 为 三 个 区 域 ， 如 图 3-3 所 示 : 

e 保留 区 (reserved area)， 用 于 存储 操作 系统 可 执行 文件 (也 称 为 磁盘 引导 区 ( disk 

boot area) ) 。 
e 文件 目录 区 (file directory area)， 包 含 存 储 在 磁盘 上 的 每 个 文件 相关 信息 的 目录 项 。 
e。 数据 存储 区 ( data storage area)， 用 于 存放 数据 或 程序 文件 ， 占 据 磁盘 的 其 余部 分 ， 
是 磁盘 上 最 大 的 一 部 分 。 

BIOS 内 风 一 张 表格 给 出 了 上 述 这 些 区 域 的 各 自 大 小 。 接 下 来 ,我 们 就 这 些 区 域 的 内 容 
逐个 展开 更 详细 的 讨论 。 

磁盘 引导 区 

文件 系统 的 最 简单 的 部 分 就 是 这 个 保留 区 ， 其 存放 了 用 于 启动 个 人 计算 机 的 操作 系统 
二 进 制 代码 。 这 个 区 域 对 于 文件 系统 是 不 可 见 的 ， 没 有 对 应 的 目录 项 ， 也 没有 名 称 。BIOS、 
BDOS 以 及 CCP 的 可 加 载 映 像 都 写 在 这 一 区 域 ， 从 0 号 磁道 的 1 号 扇 区 开始 ， 扇 区 挨 着 扇 
区 、 磁 道 挨 着 磁道 地 连续 存放 。 它 们 均 非 任何 “文件 ”的 组 成 部 分 ， 而 只 是 占用 着 磁盘 的 最 ， 
开始 的 几 条 磁道 。 一 般 情况 下 ，BIOS 为 2KB，BDOS 为 3.5SKB， 而 CCP 为 2KB， 所 以 操 
作 系 统 的 二 进 制 代码 共同 占用 了 前 三 条 磁道 。 

当 计算 机 打开 或 重启 时 ， 只 读 存 储 器 中 的 一 小 段 代码 就 会 运行 ， 把 操作 系统 可 执行 映像 
从 磁盘 复制 到 内 存 ， 然 后 开始 执行 相应 程序 ， 即 操作 系统 。 这 个 过 程 称 作 引导 ( booting) 或 
操作 系统 加 载 (OS loading) 9。 

文件 目录 区 

目录 区 的 大 小 是 固定 不 变 的 ， 被 记录 在 BIOS 的 表格 中 。 对 于 软盘 来 说 ， 目 录 最 多 可 包 
含 64 个 目录 项 ， 每 个 目录 项 为 32 字 节 人 S。 磁 盘 目 录 项 设计 如 图 3-4 所 示 。 有 目录 中 的 每 个 目 


录 项 均 包 含 如 下 信息 : 


保留 用 (1 字 节 》 


记录 数 (1 字 节 ) 


76 号 磁道 分 配 到 的 盘 岂 号 (16 字 节 ) 


图 3-3 典型 的 CP/M 文件 系统 布局 图 3-4 CP/M 文件 目录 项 





1 ) 用 户 编号 (user number)。 这 实际 上 是 从 0 到 15 的 分 组 编号 ， 支 持 多 个 用 户 或 组 别 
共享 磁盘 并 把 他 们 的 文件 分 别 整理 到 同一 组 中 。 注 意 事实 上 并 没有 子 目 录 ， 所 有 的 文件 都 在 


9 在 现代 个 人 计算 机 中 ， 类 似 的 引导 往往 由 硬盘 而 非 软盘 来 完成 。 通 常 ， 硬 盘 由 个 人 计算 机 制造 商 预 装 了 
操作 系统 。 

晶 ” 对 于 硬盘 来 说 ， 当 然 会 大 出 许多 ( 译 者 注 : 目录 所 包含 的 目录 项 数 会 更 多 ， 每 个 目录 项 自身 的 字 节 数 会 
更 大 )。 


锣 了 昔 入 党 的 澡 进 程 可 作 系 统 。 他 


同一 个 目录 下 。 分 组 编号 会 产生 一 种 支持 单 级 子 目录 的 错觉 。 但 实际 上 这 些 只 是 虚拟 的 子 
目录 。 

2 ) 文件 名 (file name) 和 文件 类 型 (file type)。 它 们 可 以 被 看 作 是 一 项 ， 有 具体 由 1 一 8 
个 字符 的 文件 名 和 0 一 3 个 字符 的 文件 类 型 组 成 ， 经 常 被 称 作 8.3 格式 文件 名 。 如 果实 际 的 
文件 名 比 “8.3 格式 ” 短 ， 则 短缺 部 分 用 空格 填充 。 文 件 名 中 并 不 支持 所 有 的 字符 。 句 点 用 
于 区 隔 文件 名 和 类 型 (如 MYFILE. DOC), 但 并 不 存储 在 目录 中 ， 所 以 文件 名 中 不 允许 使 用 
句点 或 空格 。 尽 管 操作 系统 附带 的 实用 程序 不 允许 非法 文件 名 ,但 (应 用 程序 用 来 创建 、 打 
开 或 重 命名 文件 的 ) 相关 操作 系统 调用 实际 上 并 没有 检查 文件 名 ， 因 此 ， 一 个 应 用 程序 可 以 
创建 的 文件 ， 却 有 可 能 无 法 被 其 他 程序 所 访问 。 

3 ) 延长 计数 (extent counter)。 延 长 部 分 是 由 目录 项 管控 的 文件 组 成 部 分 。 如 果 一 个 文 
件 占 用 的 盘 块 数 超过 一 个 目录 项 所 能 指定 的 盘 块 数 ， 则 必需 为 其 配备 额外 的 目录 项 。 该 文件 
的 第 一 部 分 所 对 应 的 目录 项 的 延长 计数 设置 为 零 ， 在 此 基础 上 ， 文 件 的 其 余部 分 所 对 应 的 目 
录 项 的 延长 计数 按 顺序 编号 。 于 是 ， 大 文件 将 拥有 多 个 目录 项 ,它们 具有 相同 的 文件 名 , 但 
对 应 不 同 的 文件 延长 计数 和 不 同 的 分 配 指 针 集 。 因 为 文件 可 能 被 删除 ， 并 且 它 们 的 目录 项 可 
能 被 重用 ， 所 以 目录 中 延长 计数 不 一 定 有 序 。 

4) 记录 数 (number of records)。 这 实际 上 是 延长 部 分 所 采用 的 128 字 节 的 记录 的 条 数 
( 译 者 注 : 每 个 文件 的 数据 内 容 由 分 别 对 应 于 一 个 目录 项 的 若干 延长 部 分 组 成 ， 而 每 个 延长 
部 分 又 由 分 别 对 应 后 面 所 说 的 一 个 分 配 块 的 若干 延长 记录 组 成 )。 如 果 数 据 计 数 达 到 080x 
( 译 者 注 : 即 128 字 节 ， 一 个 鹿 区 的 大 小 )， 则 本 延长 记录 已 占 满 和 用 完 ， 故 需要 磁盘 上 的 另 
一 延长 记录 。 文 件 长 度 被 四 舍 五 人 到 最 接近 的 128 字 节 ， 因 此 应 用 程序 必须 知道 在 最 后 一 条 
记录 中 真正 有 多 少数 据 。 这 导致 了 采用 Control-Z 字符 来 标记 文本 文件 结束 的 惯例 。 

5 ) 分 配 映 射 (allocation map)。 这 是 包含 文件 数据 的 磁盘 块 的 一 组 编号 (或 指针 )。 每 
个 指针 16 位 ( 即 2 字 节 )， 共 8 个 指针 。 每 个 指针 指向 磁盘 上 包含 该 文件 对 应 组 成 部 分 的 一 
个 扇 区 。 如 果 文 件 很 小 且 所 含 扇 区 少 于 8 个 ,那么 未 使 用 的 指针 值 将 被 设置 为 零 。 如 果 文 件 
太 大 且 8 个 扇 区 不 足以 容纳 该 文件 的 数据 ， 则 需 分 配 另 一 延长 部 分 和 填充 另 一 目录 项 。 在 有 
些 系统 中 ， 设 有 16 个 指针 ， 每 个 指针 8 字 节 。 这 种 不 一 致 是 制约 CP/M 推广 和 发 展 的 主要 
问题 之 一 。 

数据 存储 区 

数据 存储 区 包含 文件 的 数据 块 。 当 系统 访问 一 个 文件 时 ， 用 户 或 应 用 程序 会 提供 文件 
名 ， 文 件 系 统 将 搜索 磁盘 目录 ， 以 确定 是 否 有 该 文件 名 的 文件 存储 在 磁盘 上 。 如 果 找 到 了 拥 
有 该 文件 名 的 目录 项 ， 则 从 对 应 目录 项 中 就 可 以 找到 存储 相应 文件 的 记 区 的 地 址 ， 从 而 对 文 
件数 据 进 行 访问 。 

注意 : 真正 的 磁盘 结构 要 复杂 那么 一 丁点 儿 。 如 果 你 要 统计 上 面 描 述 的 文件 指针 在 所 有 
文件 中 所 包含 的 总 数 ， 于 是 64 (目录 项 ) *8 (文件 指针 /目录 项 ) 共 给 出 了 512 个 扇 区 ， 但 
在 一 张 软盘 上 会 有 更 多 的 扇 区 (77*26=2002 )。( 译 者 注 : 这 是 单 面 软盘 ， 对 于 双 面 软盘 ， 
扇 区 总 数 将 在 这 个 基础 上 翻 倍 ， 即 4004 个 扇 区 。) 这 将 导致 大 部 分 的 软盘 空间 无 法 被 利用 。 
为 此 ， 在 现实 当中 ,文件 指针 并 非 指 向 一 个 单独 的 扇 区 ， 而 是 指向 把 扇 区 组 织 到 一 起 所 形成 
的 分 配 块 (allocation block) 即 徐 ， 且 分 配 块 是 组 合 在 一 起 的 连续 的 扇 区 。 这 些 分 配 块 的 大 
小 是 由 磁盘 的 大 小 决定 的 ， 但 在 早期 常见 的 软盘 中 ， 分 配 块 一 般 包 括 8 个 扇 区 ， 即 1024 字 
节 。 因 此 ， 每 个 目录 项 实际 上 可 指向 最 多 8 个 分 别 为 1024 字 节 的 分 配 块 。 
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如 下 为 关于 这 种 文件 系统 的 局 限 性 及 一 些 评论 : 
。 目录 中 没有 日 期 或 时 间 。 
。 没有 项 ( 译 者 注 : 即 字段 ) 可 以 明确 标 出 文件 的 大 小 ， 故 而 文件 大 小 必须 基于 对 应 目 
录 项 中 所 包含 的 指针 数 及 可 能 的 延长 计数 进行 粗略 的 计算 。 
只 有 单一 目录 而 无 子 目录 ， 不 过 分 组 编号 可 造成 支持 一 级 子 目 录 的 假象 。 
一 个 文件 必须 整体 全 部 存储 在 一 张 磁盘 上 。 
如 果 目 录 已 满 ( 即 全 部 被 占用 )， 则 磁盘 也 被 存 满 和 全 部 被 占用 。 因 为 目录 具有 固定 
的 大 小 ， 所 以 一 张 软盘 上 只 能 存储 64 个 甚至 更 少 的 文件 。 

评论 : 对 CP/M 的 最 大 抱怨 之 一 是 8.3 格式 文件 名 ， 这 是 一 件 相 对 比较 容易 解决 的 事 
情 。 每 个 目录 项 (包括 所 存储 的 文件 名 ) 分 别 占 有 32 字 节 。 但 其 很 容易 就 能 够 被 扩展 到 48 
字 节 或 64 字 节 的 目录 项 ， 从 而 支持 23.3 格式 甚至 40.3 格式 的 名 字 ( 译 者 注 : 23.3 格式 可 能 
为 著者 笔 误 。 对 于 32 字 节 而 言 ， 除 去 文件 名 所 占 的 8+3=11 字 节 ， 应 还 有 其 他 部 分 对 应 的 
21 字 节 ; 所 以 ， 对 于 48 字 节 目录 项 ， 除 其 他 部 分 的 21 字 节 ,文件 名 应 占 27=24+3 字 节 ， 
故 应 为 24.3 格式 而 非 23.3 格式 ; 对 于 64 字 节 目录 项 ， 除 其 他 部 分 的 21 字 节 ， 文 件 名 应 占 
43=40+3 字 节 ， 故 应 为 40.3 格式 )。 不 过 ， 最 初 的 设计 非常 简单 ， 设 计 人 员 并 不 想 把 太 多 的 
磁盘 空间 用 在 目录 上 。 权 衡 之 下 ， 对 每 个 目录 项 所 占 的 磁盘 空间 (和 内 存 空间 ) 进行 了 最 小 
化 设计 处 理 。 这 对 于 软盘 来 说 是 特别 重要 的 ， 因 为 文件 内 容 和 目录 项 加 到 一 起 往往 多 达 几 百 
KB。 


3.5 ”进程 和 内 存 管理 


在 后 面 我 们 即将 学 习 的 更 为 复杂 的 操作 系统 中 ， 通 常 首先 会 论述 进程 和 内 存 管理 的 问 
题 ， 因 为 进程 对 应 于 用 户 想 要 让 系统 做 的 事情 ， 故 而 相关 问题 是 头等 重要 的 。 但 在 这 个 简单 
的 操作 系统 中 ， 进 程 管理 和 内 存 管理 的 功能 极为 有 限 ， 因 为 每 次 只 有 一 道 程序 在 执行 。 于 
是 ,硬件 抽象 和 文件 系统 的 问题 便 显得 更 为 重要 些 

尽管 如 此 ， 即 便 是 这 些 非 常 有 限 的 功能 ， 操 作 系统 也 必须 针对 进程 和 内 存 的 若干 问题 加 
以 处 理 。 首 先 ， 我 们 讨论 了 程序 执行 过 程 的 典型 流程 和 基本 环节 。 然 后 ， 我 们 讨论 了 命令 处 
理 。 最 后 ， 我 们 讨论 了 内 存 管理 和 覆盖 技术 ， 后 者 可 被 运用 于 所 创建 程序 的 大 小 超出 可 用 内 
存 空间 的 情形 。 


3.5.1 应 用 程序 的 创建 与 执行 


通常 ， 应 用 程序 是 通过 将 程序 语言 指令 输入 文本 编辑 器 中 的 方式 来 进行 编写 的 。 在 此 
基础 上 ， 应 用 程序 被 编译 或 汇编 处 理 (或 者 既 被 编译 又 被 汇编 ) 。 最 后 ， 利 用 链接 编辑 器 将 
其 与 库 例 程 链 接 到 一 起 ， 从 而 产生 一 个 可 以 加 载 到 内 存 和 运行 的 程序 映像 ( program image) 
文件 。 程 序 映 像 被 赋予 了 许多 名 字 ， 例如， 可 执行 程序 ( program executable)、 二 进 制 程序 
( program binary ) 或 可 运行 程序 ( runnable program)。 经 过 几 轮 的 调试 之 后 ， 对 应 程序 便 准 
备 就 绪 和 可 以 使 用 了 。 

为 了 让 一 个 程序 开始 运行 ， 其 可 执行 的 三 进 制 代码 文件 必须 被 加 载 到 内 存 中 。 这 个 加 载 
过 程 通常 由 CCP 来 完成 。CCP 本 身 是 一 个 提供 了 若干 内 置 功能 (built-in function) 的 应 用 程 
序 。 例 如 ,，“ DIR ”命令 用 于 列 出 所 有 文件 的 目录 ,“ ERA ”命令 用 于 删除 一 个 文件 或 者 一 
组 文件 。 在 完成 相关 工作 的 过 程 中 ，CCP 仅 对 BDOS 进行 了 调用 ， 而 从 未 直接 调用 过 BIOS 
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或 硬件 。 这 样 便 使 得 BDOS 更 容易 被 移植 到 一 个 新 的 硬件 系统 上 。 当 向 CCP 输入 一 个 名 称 
时 ， 其 首先 要 查看 和 确认 是 否 为 一 个 内 置 命令 的 名 称 。 如 果 是 ， 则 执行 对 应 命令 。 如 果 该 名 
称 不 是 一 个 内 置 命令 的 名 称 ， 那 么 CCP 将 试图 在 磁盘 上 寻找 一 个 拥有 该 名 称 的 可 执行 程序 
文件 。 如 果 能 够 找到 ， 则 会 把 对 应 文件 的 内 容 加 载 到 内 存 中 ， 从 而 开始 运行 相应 程序 。 在 程 
序 头 中 有 一 个 特殊 的 代码 ， 可 用 于 辨识 和 确定 对 应 文件 能 够 作为 一 个 可 执行 程序 。 另 外 ， 用 
户 输入 的 命令 也 可 能 是 一 个 文本 文件 的 名 称 ， 该 文件 由 CCP 读 人 和 逐条 执行 的 一 串 命 令 组 
成 。 在 CP/M 系统 中 ， 相 关 文 件 称 作 subfiles， 以 标准 扩展 名 “ .sub ”作为 文件 名 的 第 二 部 
分 。 这 种 类 型 的 命令 文件 通常 被 称 为 脚本 文件 (script file) 或 批 处 理 文 件 (batch file ) 。 

在 CP/M 系统 中 ， 普 通 的 应 用 程序 总 是 加 载 到 从 地 址 0x0100 开始 的 随机 存 取 存 储 器 
RAM 中 。 对 所 有 的 程序 指定 一 个 固定 的 加 载 地 址 ， 使 得 程序 的 开始 地 址 将 会 事先 被 获悉 ， 
从 而 方便 了 编译 器 和 链接 器 对 可 执行 程序 的 创建 。 

通常 情况 下 ,程序 需 要 额外 的 内 存 来 存放 静态 数据 ， 壁 如 像 静 态 字 符 串 之 类 的 预定 义 的 
且 大 小 固定 的 数据 。 同 时 ， 还 需要 栈 机 制 来 存放 动态 数据 ， 如 临时 变量 。 预 定义 的 静态 数据 
加 载 到 紧 随 程序 二 进 制 文件 加 载 区 域 的 内 存 中 。 紧 随 静 态 数据 的 其 他 内 存 空间 保留 用 于 存放 
其 他 数据 。 图 3-5 是 关于 一 个 正在 执行 的 程序 的 各 部 分 的 一 般 的 内 存 映 射 示意 图 。 

初始 化 时 ， 栈 设立 在 高 端 内 存 中 紧 靠 操作 系统 代码 下 面 的 位 置 。 栈 在 内 存 中 朝 较 低 内 存 
地 址 的 方向 增长 (如 图 3-5 所 示 )。 加 载 完成 后 ， 操 作 系 统 调用 对 应 程序 的 第 一 条 指令 ， 就 
好 像 其 调用 子 程序 一 样 。 该 程序 一 直 执行 ， 直 到 完成 相应 任务 ， 此 时 控制 权 仅仅 是 返回 到 加 
载 该 程序 的 CCP 中 。CCP 可 能 还 在 内 存 中 ,但 如 果 不 在 ， 就 需要 从 磁盘 重新 加 载 到 内 存 。 
当 一 道 程序 执行 时 ， 它 可 以 在 任何 想 要 的 时 候 使 用 所 有 可 用 的 内 存 ， 除 了 包含 有 操作 系统 或 
操作 系统 组 成 部 分 的 保留 内 存 区域 。 

进程 的 执行 ， 从 开始 一 直到 结束 。 其 间 ， 如 果 需 要 输入 /输出 ， 处 理 器 将 保持 空闲 直到 
其 所 需 的 输入 /输出 完成 。 例 如 ， 进 程 可 能 等 待 用 户 从 键盘 输入 。 对 于 不 能 完整 加 载 到 内 存 
的 大 型 程序 而 言 ， 其 程序 代码 通常 被 划分 为 可 分 别 装 入 到 内 存 的 若干 分 段 。 当 一 个 分 段 调用 
了 对 应 代码 不 在 内 存 的 函数 时 ， 一 种 所 谓 “ 内 存 覆 盖 ” 的 技术 会 被 用 来 把 新 的 代码 分 段 装 人 
内 存 ， 以 替换 当时 存放 在 内 存 的 另 一 代码 分 段 。 覆 盖 的 实施 交 由 应 用 程序 具体 负责 ， 不 过 应 

程序 库 通 常会 提供 一 些 辅助 支撑 功能 。 我 们 将 在 第 3.5.3 节 进 一 步 讨论 这 项 技术 。 


3.5.2 ”基于 CCP 的 命令 处 理 内 存 最 低地 址 处 


在 我 们 这 个 简单 的 操作 系统 中 ，CCP 跟 任何 
其 他 的 程序 非常 相像 。 同 时 ，CCP 或 许 比 一 些 程 
序 的 结构 设计 得 更 好 ， 因 为 它 仅 仅 使 用 操作 系统 
的 系统 调用 而 从 不 绕 过 操作 系统 。 在 其 他 的 操作 
系统 中 ， 类 似 于 CCP 的 模块 有 时 也 被 称 为 外 壳 程 
序 (shell) 或 命令 解释 器 ( command interpreter)。 
用 户 可 以 通过 输入 一 条 CCP 的 命令 或 一 
pe re pi 

。 这 种 命令 解释 器 的 另 一 个 名 称 是 命令 行 接口 
区 command line interface)， 因 为 每 条 命令 都 被 输入 内 存 最 高 地 址 处 
到 屏幕 的 一 行 上 ， 并 当 用 户 按 下 <carriage return> 图 3-5 当 执 行 一 道 程序 时 的 典型 的 内 存 内 容 
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或 <enter> 键 ( 即 回 车 键 ) 时 被 提交 给 命令 解释 器 。CCP 被 链接 加 载 到 BDOS 下 的 高 内 存 区 
域 。 当 一 道 程序 运行 完毕 时 ， 其 将 退出 和 把 控制 权 返 回 到 BDOS， 后 者 将 会 检查 确认 CCP 
是 否 完好 无 损 地 还 在 内 存 中 。 如 果 是 ，BDOS 将 无 须 重新 加 载 CCP， 而 是 会 把 控制 权 直 接 返 
回 到 CCP。 

许多 用 户 更 喜欢 附加 的 功能 或 者 不 同 的 “外 观 和 感觉 "， 例 如 菜单 或 图 形 。 用 更 适合 
一 个 人 喜好 的 外 壳 程 序 来 取代 CCP， 这 种 情况 是 相当 普遍 的 。 在 许多 操作 系统 中 ， 用 户 可 
以 从 几 个 不 同 的 外 过 程序 中 进行 选择 。 编 写 一 个 命令 处 理 程序 或 外 过 程序 是 一 项 很 有 意 
思 的 训练 。 但 是 ， 像 许多 程序 一 样 ， 当 你 和 其 他 人 要 使 用 该 外 过 程序 时 ， 其 便 需 要 增加 
一 些 新 的 和 更 复杂 的 功能 ， 例 如 重新 调用 以 往 用 过 的 命令 或 者 将 命令 连接 到 一 起 使 用 的 
能 力 。 


3.5.3 ”内 存 管理 


正如 我 们 在 第 3.5.1 节 所 讨论 的 ，CP/M 操作 系统 的 基本 的 内 存 处 理 是 非常 简单 的 。 所 
有 的 程序 都 加 载 到 内 存 空间 中 一 个 固定 的 地 址 。 程 序 被 划分 为 两 个 部 分 : 1 ) 程序 的 可 执行 
代码 ; 2 ) 固定 的 数据 ( fixed data， 或 称 为 静态 数据 ， 即 static data)， 如 程序 中 的 常量 值 和 
字符 串 等 。 

把 这 两 部 分 从 磁盘 复制 到 内 存 的 软件 称 为 装 入 程序 (loader， 或 称 为 加 载 程序 )， 是 CCP 
命令 处 理 模 块 的 组 成 部 分 。 一 个 程序 还 需要 一 定 的 栈 ( stack) 空间 来 存储 临时 变量 、 传 送 参 
数 到 所 调用 的 子 程序 以 及 从 那些 子 程序 返回 数据 。 栈 被 设立 在 内 存 中 紧 靠 操作 系统 本 身 下 方 
的 最 高 位 置 。 这 便 允 许 栈 在 内 存 中 向 下 “增长 ” 且 不 会 与 程序 的 数据 发 生 “ 碰 撞 ” 或 “ 冲 
突 ”"， 除 非 已 经 没有 更 多 的 可 用 内 存 。 图 3-5 说 明了 这 种 内 存 结构 。 

但 是 ，CP/M 并 没有 提供 关于 栈 和 固定 数据 之 间 发 生 冲 突 的 检测 机 制 。 由 于 处 理 器 并 没 
有 内 存 管 理 寄存 器 实现 内 存 保护 ， 所 以 相关 事件 往往 会 导致 程序 崩 尝 或 引发 奇怪 的 结果 。 此 
类 内 存 重 写 的 漏洞 很 难 被 发 现 和 修复 ， 在 CP/M 系统 上 经 常会 发 生 。 

对 于 采用 如 Pascal 或 C 等 高 级 程序 设计 语言 编写 的 程序 来 说 ， 有 一 个 大 的 内 存 池 是 由 
可 以 被 动态 分 配 和 回收 的 内 存 组 成 的 ， 称 为 堆 (heap)。 堆 是 由 装 入 程序 从 内 存 空间 中 划拨 
出 来 的 ,但 由 高 级 语言 运行 库 中 的 例 程 负 责 管理 。 并 非 所 有 的 程序 都 会 使 用 堆 。 但 如 果 存 在 
一 个 堆 ， 其 将 位 于 固定 数据 和 栈 之 间 的 内 存 中 。 

程序 头 位 于 紧 靠 可 执行 二 进 制 代码 的 前 面 的 内 存 中 。 程 序 头 包含 分 别 指向 栈 所 在 位 置 和 
固定 数据 所 在 位 置 的 内 存 地 址 的 指针 。 当 用 户 输入 命令 和 为 程序 提供 参数 时 ， 它 还 会 包含 一 
个 指向 作为 参数 传递 给 该 程序 的 字符 串 的 指针 。 例 如 ， 如 果 用 户 输入 命令 来 运行 一 个 文本 编 
辑 器 ， 命 令 行 也 可 能 会 包含 要 编辑 的 文件 的 名 称 。 

为 什么 操作 系统 位 于 内 存 中 最 高 地 址 的 空间 ， 而 不 是 低地 址 的 内 存 空间 呢 ? 这 是 因为 
CP/M 系统 并 非 都 拥有 相同 数量 的 内 存 。 一 些 计 算 机 可 能 拥有 32KB 的 内 存 ， 而 其 他 的 计算 
机 则 可 能 拥有 48KB 或 64KB 的 内 存 。 因 此 ， 操 作 系统 被 构建 成 (或 配置 为 ) 占据 内 存 的 最 
高 地 址 的 空间 部 分 ， 从 而 预 留 下 一 个 固定 的 地 址 (常常 是 0x0100 ) 用 于 加 载 程序 。 如 果 操 
作 系 统 变 大 了 ， 其 将 从 内 存 空 间 中 的 一 个 较 低 的 地 址 开始 ， 但 不 会 为 此 强制 任何 程序 修改 地 
址 ， 尽 管 此 时 留 给 用 户 程 序 和 容纳 用 户 程 序 运行 的 内 存 空间 会 变 少 。 这 便 意 味 着 ， 当 操作 系 
统 升级 到 一 个 新 的 版 本 时 ， 没 有 必要 重新 链接 所 有 的 应 用 程序 。 
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3.5.4 ”覆盖 


CP/M 系统 的 内 存 空 间 的 最 大 值 是 受到 对 应 处 理 器 能 够 寻 址 的 内 存 大 小 的 约束 的 。 最 
初 ， 相 关内 存 空间 最 大 值 是 64KB ， 但 有 些 后 来 的 处 理 器 支持 更 多 的 内 存 ， 还 有 一 些 计 算 机 
则 添置 了 某 些 其 他 的 硬件 ， 且 相关 硬件 提供 了 经 由 程序 控制 可 以 被 映射 到 内 存 空 间 的 所 谓 内 
存 “ 库 存 ”。 如 果 一 道 程序 无 法 在 可 用 空间 容纳 下 ， 会 发 生 什么 呢 ? 从 最 早 的 计算 机 开始 以 
来 ， 这 个 问题 就 一 直 是 个 要 害 问题 。 [61 | 

当然 ,处 理 大 量 数据 的 程序 可 以 把 一 些 数据 存放 在 磁盘 上 而 不 是 内 存 中 ， 且 在 特定 时 间 
只 是 把 所 需要 的 数据 装 人 内 存 。 然 而， 如 果 程 序 的 二 进 制 代码 非常 庞大 ， 又 可 以 采取 什么 办 
法 呢 ? 类 似 地 ， 这 些 程序 也 可 以 只 是 把 正在 处 理 所 需 的 那些 模块 装 和 信 内存。 这些 模块 或 程序 
将 会 在 内 存 中 的 相同 位 置 相互 “ 重 琶 ”"， 称 之 为 覆盖 。 拥 有 大 量 代码 的 程序 将 会 被 划分 为 主 
程序 模块 和 其 他 程序 模块 。 主 程序 模块 将 常 驻 在 内 存 空间 。 而 其 他 程序 模块 则 仅 在 需要 时 ， 
才 会 被 加 载 到 作为 覆盖 〈 以 替换 另外 的 程序 模块 ) 的 内 存 空 间 中 。 典 型 的 用 于 覆盖 的 候选 程 
序 包括 一 些 大 型 的 计算 例 程 或 错误 处 理 例 程 。 

程序 设计 人 员 必 须 能 够 识别 并 确定 程序 的 哪些 部 分 应 当 被 组 合 到 一 起 和 形成 一 个 覆盖 。 
在 设计 覆盖 时 ， 应 该 避免 一 个 覆盖 模块 调用 进入 另外 一 个 将 会 替代 内 存 中 该 覆盖 模块 的 覆 
盖 模 块 ( 译 者 注 : 也 就 是 说 ， 应 当 避 免 一 个 覆盖 模块 A， 调 用 进入 另外 一 个 将 会 奉 代 内 存 中 
该 覆盖 模块 A 的 覆盖 模块 B)， 这 是 非常 重要 的 。 覆 盖 模 块 的 真正 加 载 由 程序 设计 语言 运行 
库 来 完成 ， 其 利用 CP/M 系统 调用 来 加 载 覆盖 模块 。 程 序 设计 人 员 应 为 编译 程序 标 出 每 个 覆 
盖 可 以 对 应 程序 的 哪些 部 分 ( 即 哪 些 函数 和 过 程 )， 而 编译 程序 据 此 生成 可 加 载 的 覆盖 代码 。 
图 3-6 举例 说 明了 相关 概念 。 其 间 ， 对 应 程序 拥有 一 个 主 程序 模块 和 三 个 覆盖 模块 。 在 任何 
特定 时 间 ， 同 一 覆盖 只 会 有 一 个 覆盖 模块 存放 在 内 存 中 。 

汇编 程序 是 一 个 可 以 采用 覆盖 技术 的 程序 实例 。 源 程序 通常 会 被 读 取 两 次 。 第 一 遍 ， 汇 
编程 序 构建 一 个 符号 表 ， 并 为 代码 和 数据 分 配 空间 。 然 后 ， 源 程序 被 再 次 读 入 ， 并 发 生 实际 
的 代码 生成 过 程 。 此 时 ， 汇 编程 序 拥有 足够 的 信息 来 生成 指令 ,并 填写 它们 所 引用 的 地 址 。 
显然 ， 针 对 源 程序 的 这 两 遍 处 理 不 会 直接 引用 彼此 ， 从 而 可 以 相互 覆盖 。 在 这 个 实例 中 , 经 [62] 


常 至 少 会 有 其 他 两 个 可 能 的 覆盖 。 一 个 覆盖 是 初 内 存 最 低地 址 处 
始 化 阶段 ， 接 收 用 户 控制 选项 ， 打 开 输 入 文件 ， 
Eo 


分 配 符号 表 ， 等 等 。 第 二 个 覆盖 则 可 能 提供 额外 


的 关于 文件 的 打印 输出 ， 如 附带 有 用 户 注释 的 生 
成 代码 的 列表 。 尽 管 不 采用 覆盖 技术 ， 整 个 汇编 

履 盖 覆盖 | 覆盖 
固定 的 数据 ( 堆 ) 


程序 也 可 能 运行 在 大 型 计算 机 上 ， 但 在 较 小 的 计 
算 机 上 ， 如 果 没 有 覆盖 技术 ， 就 可 能 无 法 运行 。 

程序 栈 
3.5.5 ”进程 及 基本 的 多 任务 


此 外 ， 可 被 处 理 的 源 程序 的 大 小 受到 符号 表 存 储 
空间 的 限制 ， 因 而 采用 覆盖 技术 的 汇编 程序 能 够 

即使 是 在 内 存 容量 有 限 而 处 理 器 运行 速度 组 内 存 最 高 地 址 处 
慢 的 早期 系统 里 ， 用 户 也 希望 可 以 并 行 地 做 一 些 ”图 3-6” 当 执行 一 道 程序 时 发 生 的 内 存 覆 盖 




















处 理 更 大 的 程序 。 
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工作 。 一 种 很 常见 的 请 求 是 ， 在 前 台 进程 ( fore-ground process) 编辑 (或 玩 游 戏 ) 的 同时 ， 
可 在 后 台 进 程 (background process) 打印 一 个 文件 的 能 力 。 这 种 同时 允许 另 一 前 台 程 序 运行 
的 打印 处 理 是 一 种 非常 普遍 的 请 求 方式 。 打 印 机 是 如 此 慢 慢 腾 腾 ， 为 此 ， 开 局 一 项 打印 任务 
让 计算 机 专心 打印 ， 然 后 起 身 离开 30 分 钟 或 1 小 时 是 非常 无 聊 的 其 至 令 人 厌烦 ， 而 且 浪 费 
了 最 宝贵 的 资源 ， 即 一 个 人 的 时 间 。 特 别 当 其 间 出 了 问题 ， 而 30 分 钟 后 用 户 返 回 时 才 发 现 
打印 机 正在 等 待 用 户 处 理 的 情况 下 ， 显 得 更 是 如 此 。 

CP/M 的 解决 方案 是 设立 一 个 后 台 打 印 进程 。 一 个 小 程序 被 加 载 到 内 存 空间 高 地 址 部 分 
紧 靠 操作 系统 下 方 的 位 置 。 该 程序 完成 初始 化 后 ， 就 把 控制 权 返 回 给 CCP， 以 允许 另 一 个 
程序 运行 。 当 某 用 户 想 要 在 后 台 打 印 时 ， 要 打印 的 文件 名 便 传 递 给 后 台 打 印 处 理 程 序 。 每 当 
后 台 打 印 处 理 程 序 获得 控制 权 的 时 候 ， 便 会 打印 文件 的 一 小 部 分 ， 也 就 一 两 行 吧 。 通 常情 况 
下 ,每 当前 台 进 程 执行 系统 调用 或 者 可 能 通过 设置 定时 器 并 造成 前 台 进 程 中 断 的 时 候 ， 后 台 
进程 就 会 获得 控制 权 。 

后 台 打 印 使 计算 机 看 起 来 似乎 在 同时 做 两 件 事情 ， 即 所 谓 的 “多 任务 ”。 后 人 台 打 印 处 
理 程序 将 只 在 后 台 专 职 打印 事务 ,而 不 做 其 他 任何 事情 。 用 户 喜 欢 并 行 开展 工 作 的 理念 ， 
尤其 是 在 输入 和 输出 非常 缓慢 的 情况 下 ， 璧 如 早期 打印 机 的 打印 。 我 们 将 会 看 到 ， 所 有 
新 型 的 操作 系统 ， 即 使 是 在 非常 小 的 设备 上 的 操作 系统 ， 也 会 提供 某 种 形式 的 多 任务 处 理 
机 制 。 


3.6 小 结 


在 这 一 章 ， 我 们 介绍 了 一 种 简单 的 功能 有 限 的 操作 系统 的 典型 组 成 模块 。 我 们 的 介绍 建 
立 在 一 种 早期 的 个 人 计算 机 操作 系统 ( 即 CP/M) 和 早期 个 人 计算 机 系统 基本 硬件 的 相关 功 
能 的 基础 之 上 。 我 们 从 描述 简单 操作 系统 的 前 身 ， 即 所 谓 的 “监控 程序 ”开始 ， 讨 论 了 它们 
是 如 何 由 于 标准 化 的 需要 而 演化 成 早期 的 操作 系统 的 。 然 后 ， 我 们 描述 了 采用 这 种 类 型 操作 
系统 的 早期 个 人 计算 机 系统 的 特征 。 接 下 来 ,我们 讨论 了 在 这 样 一 种 早期 的 操作 系统 中 ， 输 
入 /输出 是 如 何 进行 管理 的 。 我 们 认识 到 ， 应 用 程序 经 常会 忽略 操作 系统 所 提供 的 标准 化 输 
入 /输出 功能 的 使 用 ， 以 便 获 得 更 好 的 性 能 和 更 大 的 灵活 性 。 

在 此 基础 上 ， 我 们 就 这 样 一 种 简单 操作 系统 的 文件 系统 以 及 该 文件 系统 所 基于 的 标准 磁 
盘 设 备 进行 了 描述 。 随 后 ， 我 们 讨论 了 进程 和 内 存 管理 。 我 们 注意 到 ， 程 序 的 二 进 制 代 码 总 
是 加 载 到 一 个 固定 的 预先 指定 的 内 存 位 置 ， 因 为 每 次 都 只 有 一 道 程序 存放 在 内 存 空 间 。 内 存 
的 其 他 部 分 则 存放 着 操作 系统 的 二 进 制 代码 和 固定 的 程序 数据 。 栈 区 域 保留 用 于 存放 动态 数 
据 。 我 们 还 讨论 了 针对 无 法 在 内 存 中 容纳 下 的 大 型 程序 的 覆盖 技术 。 和 覆盖 技术 允许 程序 设计 
人 员 把 程序 划分 成 在 需要 时 可 以 在 内 存 中 互相 替换 的 若干 分 段 。 最 后 ， 我 们 讨论 了 多 任务 的 
一 个 早期 的 例子 ， 即 后 台 打印 的 例子 。 
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早期 个 人 计算 机 的 监控 程序 提供 了 哪些 类 型 的 有 限 的 功能 ? 

对 于 调用 监控 程序 的 相关 参数 进行 了 什么 类 型 的 错误 检查 ? 可 能 的 结果 是 什么 ? 

在 个 人 计算 机 时 代 ， 有 许 许 多 多 的 小 的 新 兴 的 硬件 销售 厂商 ， 而 且 他 们 的 所 有 用 户 都 在 吵 呈 着 要 
软件 。 在 这 种 环境 中 ， 导 致 真正 操作 系统 开发 的 早期 监控 程序 的 特点 是 什么 ? 

CP/M 操作 系统 和 微软 DOS 操作 系统 设计 运行 的 硬件 系统 的 最 重要 的 特征 是 什么 ”由 此 导致 的 一 
些 决 策 结 果 是 什么 ? 

早期 程序 的 基本 输入 /输出 需求 并 不 算 高 。 然 而 ， 一 些 应 用 程序 也 有 一 些 较为 复杂 的 需求 。 在 许 
多 情况 下 ， 由 监控 程序 提供 的 功能 要 比 BIOS 代码 的 同样 功能 慢 得 多 。 当 操作 系统 提供 的 功能 遮 
挡 了 应 用 程序 所 需 的 功能 或 者 操作 系统 所 提供 的 功能 慢 得 使 应 用 程序 的 性 能 不 可 接受 时 ， 应 用 程 
序 设计 人 员 是 怎么 做 的 ?由 此 产生 了 什么 问题 ? 

除了 键盘 和 视频 显示 器 ， 早 期 操作 系统 还 关注 哪些 非常 重要 的 关键 的 输入 /输出 系统 ? 

对 于 命令 解释 器 而 言 ， 用 户 输入 的 大 多 数 命令 是 通过 在 磁盘 上 查找 拥有 该 名 称 的 程序 加 以 执行 来 
完成 的 。 但 也 有 一 些 命令 并 不 会 映射 到 磁盘 的 程序 上 。 它 们 驻 留 在 什么 地 方 ? 

在 软盘 (或 硬盘 ) 上 ， 所 有 盘面 上 的 各 个 磁头 都 会 处 于 相应 盘面 上 离 磁盘 外 侧 的 同一 相对 位 置 的 
地 方 。 当 磁盘 旋转 时 ， 盘 面 的 某 一 部 分 将 会 在 各 自 的 磁头 下 通过 。 盘 面 的 这 一 部 分 称 为 什么 ? 该 
部 分 被 划分 成 更 小 的 部 分 。 那 些 部 分 是 磁盘 的 最 小 的 可 寻 址 部 分 。 那 些 部 分 称 作 什么 ? 

CP/M 把 软盘 的 内 容 划 分 为 三 个 部 分 。 这 三 个 部 分 都 是 什么 ? 

为 什么 CP/M 操作 系统 驻 留 在 高 端 内 存 而 非 低 端 内 存 ? 

覆盖 是 在 系统 内 存 很 小 的 情况 下 使 用 的 一 种 过 时 的 技术 ， 在 现代 操作 系统 中 已 不 再 使 用 。 这 是 
真 的 还 是 假 的 ? 

尽管 CP/M 并 不 支持 真正 的 应 用 程序 多 道 处 理 ， 但 其 却 实 实在 在 允许 某 种 类 型 的 后 台 处 理 。 那 
是 什么 ? 
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Operating Systems: A Spiral Approach 


单 用 户 多 任务 操作 系统 





在 这 一 章 ， 我 们 将 讨论 一 种 比 在 第 3 章 中 所 讨论 的 操作 系统 更 复杂 的 操作 系统 ， 而 且 是 
一 种 相当 现代 的 操作 系统 。 进 一 步 说 ， 我 们 来 学 习 Palm 公司 开发 的 Palm 操作 系统 MS。 前 
一 章 所 涵盖 的 CP/M 系统 ， 起 初 每 次 仅 支持 一 道 程序 (或 进程 )， 在 其 主要 使 用 期 结束 时 ， 才 
扩展 和 引入 了 如 后 台 打印 的 功能 。 相 比 之 下 ，Palm 操作 系统 的 设计 从 一 开始 就 支持 多 个 进 
程 的 同时 运行 。 

我 们 在 第 4.1 节 中 通过 概要 介绍 Palm 操作 系统 以 及 关于 其 内 核 基础 的 背景 来 开启 本 章 
的 内 容 。 在 这 类 操作 系统 中 还 有 好 多 其 他 的 操作 系统 ， 其 中 塞 班 (Symbian ) 公司 开发 的 
EPOC 以 及 Linux 和 Windows NT 的 减 缩 版 本 最 为 出 名 。 后 者 称 为 Windows 手机 版 操作 系统 
( 即 Windows Mobile OS ; 原先 为 Windows 掌上 电脑 操作 系统 ， 即 Windows Pocket PC OS)。 
在 本 章 的 结尾 部 分 ， 我们 将 会 介绍 这 些 其 他 的 操作 系统 以 及 在 这 个 快速 发 展 的 领域 中 的 一 
些 最 近 的 发 展 动态 。Palm 操作 系统 是 针对 所 谓 个 人 数字 助理 ( Personal Digital Assistant， 
PDA， 或 称 为 掌上 电脑 ) 或 个 人 信息 管理 器 (Personal Information Manager，PIM) 的 小 型 手 
持 设备 开发 的 ， 相 关 设 备 通常 被 单个 用 户 用 来 记录 和 跟踪 个 人 日 程 安排 、 通 信 录 、 竺 办 事项 
列表 ,或 者 在 行程 途中 访问 电子 邮件 和 万 维 网 (World Wide Web)。 目 前 ， 这 些 操作 系统 应 
用 在 拥有 掌上 电脑 的 很 多 相同 功能 的 手机 上 。Palm 操作 系统 通常 每 次 只 是 运行 几 道 应 用 程 
序 ， 并 且 能 够 在 少量 应 用 程序 执行 的 同时 并 发 运行 一 些 操作 系统 进程 。 因 此 ， 它 支持 有 限 的 
并 发 执行 任务 。 与 第 3 章 中 所 描述 的 单 任务 类 型 的 操作 系统 相 比 ， 它 提供 了 更 多 的 功能 ， 故 
而 也 将 有 助 于 示例 性 地 说 明 现 代 版 的 简单 操作 系统 。 

在 第 4.2 节 ， 我们 讨论 使 用 Palm 操作 系统 的 手持 式 计算 机 的 一 些 独特 的 硬件 特性 。 这 
些 与 众 不 同 的 特性 促成 Palm 操作 系统 设计 中 所 做 的 一 些 决 定 及 选择 方案 。 在 CP/M 系统 领 
域 , 我 们 在 其 几 近 结束 的 时 候 才 见 到 其 引入 了 同时 在 内 存 中 存放 多 道 程序 ， 以 提供 诸如 弹出 
式 窗口 和 后 台 打印 的 功能 。 而 Palm 操作 系统 则 支持 更 复杂 的 多 道 程序 设计 ， 为 此 ， 我 们 在 
4.3 节 讨 论 Palm 操作 系统 中 的 应 用 程序 进程 和 操作 系统 任务 的 调度 。 

当 多 道 程序 同时 运行 在 一 个 系统 中 时 ， 内 存 管 理会 变 得 更 加 复杂 。 程 序 不 能 再 假设 其 可 
以 使 用 所 有 的 内 存 。 当 应 用 程序 提出 内 存 请 求 时 ， 操 作 系统 必须 承担 起 为 它们 分 配 相 应 的 内 
存 区 域 的 责任 。 因 此 ， 操 作 系 统 必 须要 监测 每 个 应 用 程序 所 使 用 的 内 存 ， 并 在 应 用 程序 结束 时 
对 相应 内 存 予以 回收 。 鉴 于 此 ， 在 第 4.4 节 进一步 讨论 内 存 管 理 。 第 4.5 节 介 绍 在 Palm 操作 


日 ”在 本 章 中 所 描述 的 操作 系统 功能 ， 涵 盖 Palm 操作 系统 发 行 版 5 之 前 的 各 个 版 本 。 其 发 行 版 5 是 一 种 不 同 
类 型 的 操作 系统 ， 支 持 一 种 不 同 的 处 理 器 。 我 们 认为 ,一 类 设备 及 相对 应 的 大 致 在 所 描述 层级 上 进行 工 
作 的 操作 系统 将 会 继续 存在 ， 所 以 我 们 并 没有 修改 相关 素材 来 对 应 后 来 的 版 本 。 本 章 所 涉及 的 功能 可 能 
是 未 来 一 段 时 间 内 学 生 在 类 似 的 低档 操作 系统 中 能 够 找到 的 比较 具有 代表 性 的 功能 。 例 如 ， 伴 随 纳米 技 
术 的 发 展 ， 这 样 的 机 器 非常 有 可 能 ， 它 们 往往 包含 需要 操作 系统 的 计算 机 系统 但 却 没有 辅助 存储 器 
(secondary storage， 或 称 为 第 二 级 存储 器 )。 此 外 ， 就 目前 看 来 ， 旋 转 式 的 数据 存储 设备 可 能 很 快 就 会 成 
为 过 去 ， 而 大 多 数 的 新 的 计算 机 将 拥有 巨大 容量 的 主 存 和 一 些 可 移动 的 第 三 级 存储 器 ( tertiary storage )， 
但 是 没有 第 二 级 存储 器 。 因此， 所 有 的 操作 系统 可 能 在 某 一 点 上 更 像 这 个 操作 系统 一 样 地 进行 工作 。 
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系统 中 的 文件 的 组 织 ， 而 第 4.6 节 则 介绍 Palm 操作 系统 所 提供 的 基本 的 输入 /输出 功能 。 

早期 的 掌上 电脑 在 很 大 程度 上 都 是 基于 文本 的 ， 尽 管 很 多 掌上 电脑 也 具备 了 一 些 特殊 
的 图 标 或 一 些小 块 的 拥有 图 形 化 功能 的 屏幕 部 分 。 现 在 ， 此 类 设备 则 往往 具备 面向 图 形 的 显 
示 功 能 。CP/M 是 一 种 基于 文本 的 操作 系统 ， 所 以 我 们 还 在 这 一 章 中 介绍 了 图 形 化 用 户 界面 
( Graphical User Interface，GUI) 的 一 些 简单 的 特征 。 所 有 现代 的 操作 系统 都 包括 对 图 形 化 
用 户 界 面 的 支持 ， 尽 管 对 于 操作 系统 本 身 而 言 ， 图 形 化 用 户 界面 并 不 是 其 所 固有 的 。CP/M 
系统 上 的 程序 都 假定 自己 完全 控制 着 系统 ， 故 而 被 设计 成 以 确定 的 方式 来 进行 交互 。 图 形 用 
户 界面 下 工作 的 程序 必须 处 理 伴随 程序 主要 流程 而 以 异步 方式 发 生 的 各 类 事件 。 为 此 ， 本 章 
也 引入 了 面向 事件 的 程序 设计 。 具 体 而 言 ， 第 4.7 节 介绍 显示 子 系统 ， 第 4.8 节 首 先 讨 论 面 
向 事件 的 程序 设计 ， 然 后 介绍 Palm 操作 系统 中 一 个 典型 的 应 用 程序 的 设计 。 最 后 ,我们 在 
第 4.9 节 中 对 全 章 内 容 进 行 归 纳 总 结 。 

在 本 书后 面 的 部 分 ， 我 们 将 介绍 Palm 操作 系统 及 类 似 系 统 的 一 些 更 高 级 的 功能 。 具 体 
而 言 ， 第 20 章 讨论 Palm 操作 系统 中 的 一 些 很 有 意思 的 子 系统 ， 并 对 需要 交叉 开发 系统 来 开 
发 此 类 受 限 环境 的 程序 的 基本 道理 进行 解释 ， 同 时 还 对 Palm 操作 系统 的 后 来 发 行 版 本 的 一 
些 进展 进行 介绍 。 


4.1 简单 的 多 任务 系统 


Palm 操作 系统 是 由 Palm 公司 开发 的 ， 使 用 在 他 们 的 小 型 手持 式 计算 机 上 。 典 型 的 手 
持 式 计算 机 装置 如 图 4-1 所 示 。 该 平台 已 经 变 得 非常 普遍 。 不 少 硬件 厂商 ， 包 括 腾 跃 公司 
(Handspring)、 索 尼 ( Sony) 公司 、 美 国 国际 商用 机 器 公司 (IBM)， 都 已 生产 出 了 与 相关 技 
术 一 致 的 设备 。 同 样 的 操作 系统 还 被 用 在 了 多 款 手 机 上 ， 包 括 Treo 和 三 星 500 ( Samsung ) 。 
与 大 多 数 通用 计算 机 或 个 人 计算 机 相 比 ，Palm 操作 系统 运行 的 环境 具有 一 些 不 寻常 的 特征 。 
这 些 特点 促成 了 开发 操作 系统 时 所 做 的 一 些 不 寻常 的 决定 。 尽 管 如 此 ， 这 些 特 点 在 即将 面世 
的 越 来 越 多 的 系统 中 非常 具有 代表 性 ， 所 以 对 于 无 论 当 前 的 还 是 未 来 的 操作 系统 的 设计 者 而 
言 ， 这 些 特征 实际 上 并 不 是 可 有 可 无 的 ， 而 是 相当 重要 。 这 些 特 点 还 限制 了 操作 系统 的 设计 
目标 ， 故 而 相关 操作 系统 与 第 3 章 所 介绍 的 单 进程 操作 系统 相 比 ， 只 是 复杂 那么 一 丁点 ， 具 
体 总 结 如 表 4-1 所 示 。 





屏幕 
计算 器 
搜索 
涂鸦 区 
待 做 事项 表 4-1 Palm 操作 系统 的 与 众 不 同 的 特征 
菜单 实时 操作 系统 任务 ， 但 并 非 实时 的 应 用 程序 
通信 录 全 因 态 存 傅 器 
日 历 低 功 耗 ， 以 节省 电池 
记事 本 单一 窗口 的 图 形 化 用 户 界 面 
导航 按钮 多 种 文本 输入 选项 


图 4-1 Palm Pilot 掌上 电脑 示意 图 通过 插件 进行 扩展 
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在 这 些 不 寻常 的 特点 中 ， 第 一 项 特征 源 自 于 相关 手持 式 计算 机 是 它们 之 前 的 掌上 电脑 的 
成 熟 版 本 的 事实 。 这 些 手持 式 计算 机 被 设计 成 了 赋予 那些 与 用 户 进行 交互 的 服务 以 最 高 的 优 
先 权 ， 从 而 导致 了 操作 系统 实际 上 是 建立 在 一 个 实时 内 核 的 上 面 ， 而 该 内 核 是 由 Palm 公司 
从 另 一 个 供应 商 那 里 授权 获得 的 9。 例 如， 这 个 实时 内 核 允 许 系统 支持 在 一 小 部 分 的 液晶 显 
示 器 (Liquid Crystal Display，LCD) 屏幕 上 进行 “ 写 ” 操 作 的 触 控 笔 〈stylus， 或 称 为 手写 笔 ) 
的 使 用 。 该 屏幕 是 触摸 敏感 的 ， 触 摸 屏幕 (最 好 是 用 手写 笔 ) 将 导致 一 个 中 断 把 触摸 到 的 屏 
幕 位 置 的 坐标 传 给 一 个 用 于 跟踪 触 控 笔 在 屏幕 上 移动 的 例 程 。 操 作 系统 试图 实时 地 读 取 和 解 
释 笔迹 ， 这 在 Palm 操作 系统 中 称 为 涂鸦 式 输 入 ( graffiti input) 9。 在 操作 系统 处 理 这 项 实 
时 任务 时 ， 也 允许 若干 应 用 程序 同时 运行 在 相应 机 器 上 。 支 持 多 个 应 用 程序 及 实时 内 核 并 发 
运行 要 求 采用 多 任务 (multitasking) 或 多 道 程序 (multiprogramming) 的 系统 设计 。 

在 支持 应 用 程序 方面 ，Palm 操作 系统 设计 如 下 : 

e 读 取 邮件 。 

。 在 通信 短 中 记录 联系 方式 。 

e 保持 费用 记录 。 

e 通过 报警 提醒 来 增强 待 做 事项 功能 。 

e 玩 诸如 数 独 (Sudoku) 之 类 的 简单 游戏 。 

e 通过 万 维 网 访问 信息 。 

Palm 操作 系统 不 是 特意 要 同时 支持 多 个 用 户 ， 也 不 是 特意 要 成 为 一 个 网 站 服务 器 。 因 
此 ， 操 作 系 统 的 实时 和 多 任务 的 特点 并 没有 通过 应 用 程序 编程 接口 (Application Programming 
Interface，API) 暴露 给 应 用 程序 编程 设计 人 员 。 

这 些 系 统 的 另 一 个 独特 的 方面 是 ， 通 常 没有 辅助 存储 器 ， 也 就 是 说 ， 所 有 的 系统 内 存 
均 为 主 存储 器 ( 即 电子 类 主 内 存 )。 这 些 手持 式 系统 的 有 限 的 内 存 和 处 理 器 性 能 导致 了 内 
存 管 理 的 特殊 设计 及 基本 输入 /输出 操作 的 一 些 特 殊 处 理 。 某 些 设 备 提 供 有 插件 功能 ， 从 
而 允许 不 同类 型 的 卡 (card) 或 模块 (module) 连接 到 相应 设备 上 。 相 关卡 可 以 是 预 装 了 特 
定 应 用 程序 的 存储 卡 、 全 球 定位 系统 ( Global Positioning System，GPS ) 导航 设备 、 数 码 
相机 甚至 硬盘 。 然 而 ， 基 本 硬件 并 没有 辅助 存储 器 ， 所 以 操作 系统 的 设计 必须 要 反映 这 一 
点 。 关 于 辅助 存储 器 的 支持 已 被 移植 到 主要 的 系统 设计 上 ， 对 此 我 们 将 在 后 面 展 开 更 详细 
地 讨论 。 

Palm 操作 系统 支持 面向 用 户 的 图 形 化 用 户 界面 方式 的 显示 输出 。 鉴 于 系统 较 小 的 屏幕 
尺寸 ， 所 以 界面 编程 设计 往往 会 有 一 些 特殊 的 考虑 。 特 别 地 ， 在 任何 时 候 ， 屏 幕 上 经 常 只 有 
一 个 单一 的 窗口 ( window， 或 窗 体 ， 即 form) 是 可 见 的 。 有 时 可 能 会 有 一 些 更 小 的 对 话 框 
或 警报 框 显示 在 该 窗口 的 前 面 。 最 后 ， 这 些 系统 支持 若干 种 不 同 的 机 制 来 接受 用 户 的 文本 输 
入 ,但 系统 试图 在 应 用 程序 层面 隐藏 这 些 机 制 之 间 的 不 同 。 


4.2 ”Palm 操作 系统 运行 环境 及 系统 布局 


在 设计 Palm 操作 系统 时 ， 需 要 考虑 Palm 设备 的 一 些 特点 ， 具 体 包括 : 
e 基本 内 存 为 易 变 性 随机 访问 存储 器 (RAM)。 


日 该 系统 就 是 柯达 产品 有 限 公 司 (KADAK Products Limited) 的 AMX™ 多 任务 执行 系统 。 
是 “2003 年 ，PalmSource 公司 输 掉 了 一 场 使 用 原创 的 涂鸦 软件 的 官司 。 目 前 使 用 的 该 软件 称 作 Graffiti 2。 我 
们 采用 简化 的 术语 作为 此 项 功能 的 通用 名 称 。 
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通常 没有 辅助 存储 器。 

小 屏幕 尺寸 。 

键盘 并 非 标 配 。 

处 理 器 运行 缓慢 以 降低 电池 消耗 。 


4.2.1 基本 内 存 为 易 失 性 随机 访问 存储 器 


Palm 操作 系统 设计 所 支持 的 手持 式 计算 机 拥有 一 些 与 众 不 同 的 特征 。 首 先 ， 相 关 装 置 
采用 电池 供电 方式 ， 故 而 硬件 与 操作 系统 的 设计 均 须 遵循 和 反映 这 一 现实 情况 。 如 果 系 统 几 
分 钟 未 曾 使 用 ， 其 应 当 把 自己 置 为 睡眠 模式 (sleep mode) 以 使 消耗 很 少 的 电量 。 此 时 处 理 
器 仍 在 运行 ， 所 以 当 用 户 按 动 按钮 时 ， 操 作 系统 能 够 检测 到 。 当 然 ， 此 时 的 处 理 器 运行 得 非 
常 缓慢 ， 且 处 于 一 个 等 待 中 断 的 小 的 循环 之 中 。 实 际 上 ， 对 内 存 的 供电 始终 就 没有 停止 过 。 
即便 当 处 理 器 和 操作 系统 都 已 终止 的 时 候 ， 内 存 仍然 处 于 加 电 状 态 。 硬 件 拥有 一 股 很 小 的 电 
流 来 维持 内 存 的 内 容 。( 为 系统 增加 一 些 内 存 模块 也 是 可 能 的 ， 包括 只 读 存储 器 ( ROM) 或 
可 编程 只 读 存储 器 (PROM)， 后 者 有 时 也 称 作 闪 存 。 不 过 ， 基 本 设计 是 假定 所 有 的 主 存 都 是 
易 失 性 的 。) 


4.2.2 没有 辅助 存储 器 


这 些 手持 式 系统 的 第 二 项 与 众 不 同 的 特征 是 ， 在 最 初 的 设计 方案 中 ， 它 们 并 不 拥有 任何 
辅助 存储 器 ， 也 就 是 说 ， 没 有 磁盘 、 光 盘 、 数 字 化 视频 光盘 ， 也 没有 磁带 驱动 器 。 所 有 的 数 
据 和 程序 都 保存 在 一 个 单一 的 地 址 空间 里 。 该 内 存 中 有 些 是 可 以 从 计算 机 上 取 下 的 部 件 (或 
卡片 ) 上 的 ROM。 这 便 允 许 程 序 和 数据 库 加 载 到 相关 部 件 上 并 根据 要 求 插 到 相应 的 机 器 上 。 
无 论 是 在 可 移动 的 卡片 上 还 是 内 内在 机 器 上 ， 所 有 的 内 存 始终 都 是 可 见 的 ， 这 样 ， 所 有 的 程 
序 和 所 有 的 数据 库 就 始终 是 可 以 直接 访问 到 的 。 与 Palm 操作 系统 兼容 的 硬件 的 一 些 供应 商 
还 增添 了 一 种 独特 的 就 像 辅助 存储 器 一 样 通过 输入 /输出 命令 来 访问 的 内 存 类 型 。 该 内 存 并 
非 主 存 地 址 空间 的 组 成 部 分 ， 故 而 需要 特别 的 操作 系统 命令 来 进行 访问 。 这 类 内 存 是 可 移动 
的 ， 故 将 被 用 于 从 一 个 系统 到 另 一 个 系统 的 信息 迁移 。 其 被 设计 成 仿真 磁盘 驱动 器 的 使 用 方 
式 ， 所 以 在 物理 上 也 兼容 其 他 的 硬件 系统 。 


4.2.3 小 屏幕 尺寸 


下 一 项 特征 是 把 图 形 化 用 户 界面 呈现 给 用 户 的 液晶 显示 器 (Liquid Crystal Display， 
LCD) 的 类 型 。 其 系统 功能 与 其 他 当前 的 系统 如 采用 了 支持 图 形 化 用 户 界面 的 操作 系统 
的 个 人 计算 机 所 使 用 的 阴极 射线 管 ( Cathode Ray Tube，CRT) 或 液晶 显示 器 的 屏幕 相 
类 似 。 主 要 的 区 别 在 于 屏幕 的 大 小 ( 即 屏幕 的 尺寸 )。 因 为 照 字 面 意思 来 说 ， 相 关 设 备 应 当 
是 被 设计 来 要 适合 放 到 一 个 用 户 的 手 上 的 ， 屏幕 显示 自然 受到 了 限制 。 对 于 大 多 数 其 他 的 图 
形 化 用 户 界 面 来 讲 ， 在 屏幕 上 可 以 同时 有 多 个 窗口 打开 。 于 是 这 些 窗口 常常 相互 重 肆 ， 一 些 
窗口 的 某 些 部 分 就 被 它们 前 面 的 其 他 窗口 遮挡 和 隐藏 起 来 了 。 为 此 ， 往 往 可 能 通过 最 大 化 一 
个 窗口 来 填充 (几乎 ) 整个 屏幕 。 

与 其 他 的 图 形 化 用 户 界面 相 比 ，Palm 操作 系统 的 应 用 程序 窗口 会 填 满 整个 屏幕 。 相 关 
应 用 程序 仍旧 可 以 使 用 下 拉 式 菜单 和 对 话 框 ， 但 通常 不 会 有 其 他 的 应 用 程序 窗口 被 部 分 地 隐 
藏 在 当前 运行 的 应 用 程序 的 窗口 的 后 面 。 
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4.2.4 没有 键盘 


个 人 数字 助理 手持 式 系统 的 最 后 一 个 很 有 意思 的 方面 
是 ， 它 们 最初 没有 键盘 。 有 一 些 可 用 的 外 接 拆 印 式 键 盘 ， 
后 来 的 一 些 模型 才 切 切实 实 拥 有 了 一 个 实际 的 键盘 ， 但 这 
并 不 是 系统 通常 所 假定 的 获取 用 户 输入 的 方式 。 常 见 的 输 
入 方式 是 涂鸦 式 输入 ， 正 如 在 第 4.1 节 中 所 讨论 的 那样 。 
那 才 是 被 普遍 接受 的 ， 因 为 大 多 数 的 个 人 数字 助理 的 应 用 
程序 都 不 期 望 大 量 的 输入 。 

图 4-2 给 出 了 Palm 操作 系统 的 总 体 设计 。 紧 靠 硬件 调制 解 调 器 管理 器 
上 面 的 是 一 个 被 称 为 硬件 抽象 层 ( Hardware Abstraction 资源 管理 器 
Layer，HAL) 的 软件 层 。 其 作用 是 把 软件 的 其 余部 分 同 
硬件 设备 的 具体 细节 隔离 开 来 ， 从 而 允许 操作 系统 内 核 开 
发 人 员 构 建 出 一 个 很 容易 就 能 够 移植 到 另 一 套 硬 件 平 台 的 
操作 系统 。 操 作 系 统 的 内 核 位 于 硬件 抽象 层 的 上 面 。 操 作 
系统 提供 的 许多 服务 并 不 是 内 核 的 组 成 部 分 ， 而 是 位 于 内 
核 的 上 面 。 在 系统 服务 层 (其 总 是 在 内 核 之 上 的 层次 ) 的 
上 方 将 会 是 可 选 的 系统 库 例 程 ， 再 上 面 会 是 应 用 程序 库 例 ”图 4-2 Palm 操作 系统 体系 结构 
程 ， 而 最 上 面 ， 则 是 应 用 程序 自身 。 


4.3 进程 调度 
在 Palm 操作 系统 的 多 任务 环境 中 ， 任 何人 都 需要 分 清 操作 系统 进程 和 应 用 程序 进程。 


在 这 一 节 中 ， 我 们 分 别 讨论 了 这 两 种 类 型 的 一 些 具体 的 进程 ， 并 阐明 了 Palm 操作 系统 是 如 
何 处 理 和 调度 这 些 进 程 的 。 


4.3.1 ”处 理 涂鸦 式 输 入 一 一 实时 操作 系统 任务 


正如 在 第 1 章 中 所 提 到 的 ， 有 许多 任务 最 好 能 够 在 操作 系统 中 完成 。 把 功能 放 在 操作 
系统 中 有 诸多 的 理由 ， 但 通常 是 因为 许多 应 用 程序 都 会 用 到 它们 。 将 对 应 功能 放 在 操作 系统 
里 来 实现 ， 简 化 了 应 用 程序 设计 人 员 的 开发 工作 ， 同 时 保证 所 有 的 应 用 程序 能 够 以 相似 的 方 
式 来 执行 功能 ， 并 降低 了 相关 应 用 程序 在 对 应 部 分 发 生 错误 的 可 能 性 。Palm 操作 系统 中 关 
于 此 类 任务 的 一 个 最 好 的 例子 是 涂鸦 式 输 入 功能 。Palm 操作 系统 所 在 计算 机 系统 的 显示 往 
往 是 在 一 个 触摸 敏感 的 液晶 显示 面板 上 进行 的 。 用 户 一 般 通 过 在 这 个 屏幕 上 涂 画 字符 来 把 
数据 输入 掌上 电脑 。 这 是 一 类 专门 由 操作 系统 来 完成 的 任务 ， 具 体 涉及 手写 笔 跟 踪 ( stylus 
tracking) 和 字符 识别 (character recognition ) 两 项 操作 系统 任务 。 

为 了 跟踪 一 支 触 控 笔 在 液晶 显示 器 屏幕 的 涂鸦 区 表面 上 的 活动 轨迹 ， 处 理 器 必须 快速 和 
反复 检查 确认 触 控 笔 的 当前 位 置 。 相 关 跟 踪 是 一 项 实时 性 的 任务 ， 因 为 系统 需要 能 够 保证 其 
可 以 频繁 地 和 足够 迅捷 地 检查 触 控 笔 的 位 置 以 跟踪 记录 触 控 笔 的 运动 。 由 于 在 这 些 设备 上 的 
处 理 器 要 比 个 人 计算 机 或 工作 站 上 的 处 理 器 运行 得 更 为 缓慢 ， 所 以 相关 任务 要 更 为 麻烦 些 。 
当 触 控 笔 改变 方向 时 ， 对 应 跟踪 任务 应 能 辨别 出 来 ， 同 时 应 把 相关 活动 轨迹 分 解 成 一 些小 的 
向 量 ,， 并 将 之 传递 给 字符 识别 任务 。 一 旦 对 触 控 笔 的 位 置 向 量 进行 了 分 析 和 辨认 ， 相 应 字符 
可 以 被 识别 出 来 。 同 样 ， 字 符 识别 任务 也 是 由 操作 系统 来 完成 的 。 每 个 应 用 程序 的 开发 人 员 
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都 不 想 自己 编程 来 实现 一 个 手写 识别 器 。 事 实 上 ， 这 是 Palm 操作 系统 给 市 场 带 来 的 掌上 电 
脑 技术 的 进步 之 一 。 与 触 控 笔 跟 踪 任务 相 比 ,手写 识 别 任务 的 处 理 要 更 为 悠 亲 和 宽松 。 当 相 
应 字符 被 识别 出 来 以 后 ， 手 写 识 别 任务 将 把 它们 传送 给 相关 的 应 用 程序 ， 后 者 必须 将 它们 回 
显 在 液晶 显示 屏幕 的 适当 位 置 上 ， 以 便 用 户 获得 字符 输入 的 反馈 信息 ， 就 像 个 人 计算 机 上 的 
键盘 输入 方式 一 样 。 [L73 


4.3.2 ”应 用 程序 进程 一 一 任何 时 候 只 能 有 一 道 进程 持 有 焦点 


在 大 多 数 系统 中 ， 用 户 可 以 同时 运行 多 道 应 用 程序 。 但 在 Palm 操作 系统 中 ,任何 时 候 
只 会 有 一 道 用 户 应 用 程序 明显 地 被 看 到 正在 运行 中 。 尽 管 如 此 ， 大 多 数 Palm 应 用 程序 并 没 
有 用 户 可 以 调用 的 “ exit” 函 数 。 当 用 户 选中 一 道 新 的 应 用 程序 时 ， 任 何 正在 运行 的 应 用 程 
序 将 会 被 操作 系统 从 用 户 面前 隐藏 起 来 。 为 此 ， 在 Palm 操作 系统 中 ， 任 何 时 候 只 会 有 一 道 
正在 运行 的 应 用 程序 持 有 焦点 ( focus) 一 一 也 就 是 说 ， 掌 控 着 屏幕 窗口 ( screen window)， 
并 接受 和 显示 输入 。 不 过 ， 其 他 的 应 用 程序 有 时 也 可 能 运行 ， 只 是 未 持 有 焦点 而 已 。 此 类 功 
能 的 一 个 实例 是 文本 搜索 功能 。 如 果 用 户 执行 文本 搜索 ，Palm 操作 系统 会 顺序 调用 那些 已 
向 操作 系统 说 明 提 供 有 针对 其 自身 数据 库 文 件 进行 文本 搜索 功能 的 每 一 道 应 用 程序 。 各 应 用 
程序 将 被 请 求 在 其 数据 库 中 搜索 用 户 输入 的 待 查 字 符 串 。 但 是 ， 这 些 应 用 程序 不 会 获得 屏幕 
的 控制 权 ， 而 只 是 向 操作 系统 汇报 它们 的 结果 。 

在 Sync 应 用 程序 ( Sync application) 中 可 找到 关于 正在 运行 但 未 持 有 屏幕 焦点 的 任务 
的 另 一 个 实例 。 该 应 用 程序 用 于 实现 手持 式 装置 上 的 数据 库 文 件 与 个 人 计算 机 上 的 数据 库 文 
件 之 间 的 同步 。 个 人 计算 机 运行 着 一 道 对 应 的 同步 处 理 程序 ， 而 两 个 系统 之 间 采 用 某 种 串 行 
通信 和 链 路 进行 通信 。 相 关 链 接 可 能 是 红外 方式 、 蓝 牙 方式 或 通用 串 行 总 线 ( Universal Serial 
Bus，USB) 有 线 链 接 方式 。 尽 管 该 应 用 程序 通常 持 有 焦点 ,但 同步 处 理 操 作 执行 的 同时 往往 
没有 用 户 输入 。 当 然 ， 有 时 用 户 可 能 想 要 在 同步 处 理 完成 之 前 终止 同步 处 理 操 作 。 能 够 满足 
此 类 要 求 的 一 种 解决 方案 是 把 Sync 应 用 程序 设计 成 “发 送 一 块 数据 然后 检查 屏幕 是 否 发 生 触 
控 笔 页 击 ” 的 循环 框架 。 不 过 ， 如 果 这 样 ， 将 会 降低 串 行 通信 的 效率 ， 并 会 延迟 对 触 控 笔 敲 
击 的 响应 。 鉴 于 此 ，Palm 系统 的 Sync 应 用 程序 采用 了 两 个 任务 并 举 的 解决 方案 ， 即 通过 一 个 
实时 任务 基于 中 断 进行 屏幕 触 磁 事件 的 响应 ， 而 同步 处 理应 用 程序 则 全 力 专 注 于 通信 任务 。 


4.3.3 ”典型 的 用 户 应 用 程序 


大 多 数 的 Palm 操作 系统 应 用 程序 主要 涉及 数据 库 和 图 形 化 用 户 界面 接口 ， 并 用 来 设计 
和 实现 信息 相关 的 组 织 。 典 型 的 应 用 程序 包含 有 待 办 事项 清单 、 地 址 和 联系 人 信息 、 预 约 日 
程 表 以 及 各 式 各 样 的 闹 铃 。 为 此 ， 它 们 并 不 直接 涉及 实时 任务 。 正 如 前 面 所 描述 的 那样 ， 操 
作 系 统 利用 实时 任务 来 处 理 触 控 笔 输入 操作 。 应 用 程序 本 身 只 是 输入 和 显示 诸如 用 户 预约 之 
类 事务 相关 的 信息 。 所 以 ， 普 通 的 用 户 应 用 程序 并 不 需要 启动 额外 的 任务 ， 就 像 Sync 系统 
应 用 程序 一 样 。 各 应 用 程序 的 主干 部 分 是 一 个 所 谓 事件 循环 (event loop) 的 循环 。 操 作 系 统 
“启动 ”应 用 程序 。 应 用 程序 检查 确认 这 是 否 是 其 第 一 次 运行 。 如 果 是 第 一 次 运行 ， 则 其 将 
初始 化 所 维护 的 所 有 数据 库 。 然 后 ， 进 入 等 待 事件 的 循环 中 。 大 多 数 事 件 是 诸如 涂鸦 式 输入 
所 做 的 字符 识别 或 菜单 列表 中 选 定 菜单 条 之 类 的 活动 。 

有 一 些 独特 的 系统 事件 ， 壁 如， 通知 所 有 的 应 用 程序 “系统 即将 进入 睡眠 模式 ”。 另 外 
一 种 常见 的 事件 类 型 是 “ appStopEvent”。 正 如 之 前 所 提 到 的 ， 当 用 户 选 定 一 个 应 用 程序 运 [74] 
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行 时 ， 该 应 用 程序 将 成 为 活跃 的 应 用 程序 ， 同 时 操作 系统 将 强迫 当前 运行 的 应 用 程序 停 下 
来 。 在 不 同 的 环境 中 ， 另 外 的 操作 系统 不 会 仅仅 因为 一 道 应 用 程序 未 持 有 焦点 就 把 它 停 下 
来 。 如 果 用 户 要 切换 回 该 应 用 程序 ， 重 新 启动 该 应 用 程序 将 需要 太 多 的 输入 /输出 和 处 理 器 
处 理 。 然 而 ， 在 Palm 手持 式 系统 上 ， 无 论 是 程序 还 是 文件 ， 都 始终 存放 在 主 存 空间 中 ,所 
以 并 不 需要 完成 诸如 给 程序 分 配 内 存 、 从 磁盘 驱动 器 读 取 可 执行 模块 并 打开 相应 文件 等 各 项 
任务 。 如 果 用 户 重新 选中 一 道 已 经 关 停 的 应 用 程序 ， 该 应 用 程序 所 做 的 全 部 事情 就 是 ， 认 识 
到 其 文件 已 经 初始 化 ， 并 进入 关于 检查 其 需要 处 理 的 事件 队列 的 循环 过 程 之 中 。 为 此 ， 对 于 
只 是 等 待 用 户 从 菜单 中 或 通过 图 形 化 用 户 界面 选择 一 些 功能 的 典型 的 应 用 程序 而 言 ， 关 停 可 
能 并 不 意味 着 什么 。 不 过 ， 例 如 ， 对 于 正在 运行 的 用 户 跟 计算 机 对 抗 的 游戏 类 程序 ， 如 果 用 
户 要 切换 到 另 一 道 应 用 程序 ， 则 相应 游戏 程序 将 可 能 暂停 相关 操作 。 


4.3.4 真正 的 调度 程序 开始 成 形 


就 Palm 操作 系统 所 使 用 的 实际 的 进程 调度 程序 来 说 ， 其 是 一 种 抢占 式 多 任务 调度 程序 。 
这 意味 着 该 调度 程序 已 经 准备 好 要 运行 多 道 任务 和 根据 需要 在 这 些 任务 之 间 进 行 切 换 ， 从 而 
满足 系统 的 需求 。 不 同类 型 的 任务 具有 不 同 的 优先 级 ， 操 作 系 统 调度 程序 将 动态 地 确定 哪个 
任务 是 最 重要 的 ， 进 而 中 断 一 个 不 太 重 要 的 任务 和 转向 运行 一 个 更 为 重要 的 任务 。 中 断 一 个 
任务 来 运行 另 一 个 任务 被 称 为 抢占 (preemption)。 通 过 把 处 理 器 从 不 那么 重要 的 任务 那里 抢 
走 ， 从 而 达到 使 更 重要 任务 可 以 率先 执行 的 目的 。 操 作 系统 的 各 种 类 型 的 处 理 器 调度 程序 将 
在 第 9 章 展 开 进 一 步 详 细 的 讨论 。 


4.4 ”内 存 管理 


由 于 在 Palm 系统 中 有 许多 进程 共享 着 主 存 ， 所 以 操作 系统 必须 提供 大 量 的 内 存 管 理 功 
能 。 第 一 项 任务 就 是 查看 各 个 进程 不 要 访问 它们 自身 分 配 到 的 内 存 以 外 的 任何 位 置 ， 同 时 还 
必须 要 监测 当前 未 被 使 用 的 内 存 的 情况 。 


4.4.1 内存 基础 知识 


在 Palm 系统 中 的 内 存 访问 采用 32 位 地 址 ， 总 共 支 持 4GB ( 译 者 注 : 实际 应 为 4X 
1024X1024X1024 字 节 ， 约 为 4 千 浪 字 节 ) 的 地 址 空间 。 应 用 程序 所 见 到 的 内 存 视图 反映 
了 这 一 点 ， 而 实际 的 物理 内 存 是 在 一 块 或 多 块 存储 卡 ( 即 内 存 条 ) 上 。 每 块 存储 卡 对 应 最 少 
256MB ( 译 者 注 : 实际 应 为 256X1024X1024 字 节 ， 约 为 256 兆 字 节 ) 的 逻辑 地 址 空间 。 存 
储 卡通 常 是 可 更 换 的 ， 所 以 系统 的 内 存 总 量 可 以 升级 和 扩大 。 尽 管 最 初 的 硬件 设计 仅 支 持 一 
块 存储 卡 ,但 比较 新 的 系统 则 支持 多 块 存储 卡 。 存 储 卡 可 能 包含 如 下 三 种 不 同类 型 的 内 存 : 

e。 只 读 存储 器 (Read-Only Memory,，ROM)。 

e。 可 编程 只 读 存 储 器 ( Programmable Read-Only Memory，PROM ; 也 称 为 闪存 ， 即 

flash memory) 或 非 易 失 性 随机 访问 存储 器 (Nonvolatile RAM, NVRAM)。 

e 随机 访问 存储 器 (Random Access Memory，RAM)。 

所 有 的 存储 卡 都 至 少 包含 一 些 RAM ; 而 存储 卡 上 是 否 出 现 其 他 两 种 类 型 的 内 存 则 取决 于 
存储 卡 。 起 初 ， 操 作 系统 及 整个 初始 的 应 用 程序 集 都 包含 在 ROM 中 ， 但 现在 它们 往往 存放 
在 PROM 中 ， 从 而 方便 它们 的 更 新 升级 。 其 他 的 应 用 程序 则 可 以 安装 在 PROM 或 RAM 上 。 

从 人 逻辑 上 来 说 ，RAM 划分 为 两 个 部 分 : 1 ) 一 部 分 RAM 当 作 是 易 失 性 的 ， 称 为 动态 型 
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RAM; 2 ) 另 一 部 分 RAM 当 作 是 非 易 失 性 的 9 (NVRAM)， 称 为 存储 型 RAM 。 

如 果 存 储 卡 上 有 可 编程 只 读 存储 器 ， 则 总 被 认为 是 存储 型 随机 访问 存储 器 ， 因 为 其 实际 
上 是 非 易 失 性 的 。 动 态 型 随机 访问 存储 器 的 使 用 跟 传统 的 随机 访问 存储 器 在 大 多 数 计算 机 系 
统 中 的 使 用 一 样 。 当 系统 关闭 ( 即 转 入 低 功 耗 睡眠 模式 ) 时 ， 整 个 随机 访问 存储 器 的 内 容 被 
保存 下 来 。 但 是 ， 当 系统 开启 或 被 引导 (booted) 时 ， 动 态 型 随机 访问 存储 器 部 分 的 内 容 会 
由 操作 系统 重新 设置 。 存 储 型 随机 访问 存储 器 部 分 按 大 多 数 系 统 中 的 磁盘 驱动 器 使 用 的 相同 
的 方式 来 进行 使 用 一 一 用 于 存放 那些 旨 在 长 久保 留 的 持久 性 数据 (persistent data ; 即 文件 或 
数据 库 )。 存 储 型 随机 访问 存储 器 也 可 以 存放 操作 系统 的 扩展 部 分 (可 能 是 修复 之 类 的 程序 ) 
以 及 其 他 的 应 用 程序 。 

既然 存储 卡 是 可 更 换 的 ， 就 需要 有 一 种 机 制 能 够 把 存储 型 随机 访问 存储 器 中 所 包含 的 内 
容 保存 下 来 。 具 体 方法 是 ， 先 利用 Sync 应 用 程序 把 存储 型 随机 访问 存储 器 的 内 容 同步 到 个 
人 计算 机 上 ， 然 后 更 换 存储 卡 ， 再 把 个 人 计算 机 上 的 相应 内 容 同步 回 Palm 系统 上 。 和 采用 这 
种 方法 时 ， 个 人 计算 机 充当 了 存储 卡 内 容 的 备份 设备 。 同 样 ， 我 们 也 可 以 考虑 把 Palm 系统 
作为 移动 设备 (mobile device)， 从 而 来 缓存 通常 驻 留 在 个 人 计算 机 上 的 部 分 用 户 文件 和 数据 
库 的 副本 。 


4.4.2 内存 分 配 


内 存 被 Palm 操作 系统 作为 堆 S ( heap ) 来 进行 管理 一 一 也 就 是 说 ， 内 存 分 片 由 操作 系统 
进行 分 配 和 跟踪 ; 当 应 用 程序 运行 时 ， 在 堆 内 进行 访问 ; 最 后 ， 由 程序 释放 ， 并 被 操作 系统 
归还 到 可 用 的 内 存 池 中 。 这 些 内 存 分 片 在 Palm 操作 系统 中 被 称 为 内 存 块 (memory chunk)。 
至 少 有 三 个 堆 ， 即 每 类 内 存 (包括 ROM、 动 态 型 RAM 和 存储 型 RAM) 分 别 各 作为 一 个 堆 。 
在 较 新 版 本 的 Palm 操作 系统 中 ， 一 些 这 样 的 内 存 区 可 能 被 划分 成 两 个 以 上 的 堆 。 当 一 个 应 
用 程序 提出 请 求 时 ， 操 作 系 统 就 在 各 个 堆 中 分 配 堆 空 间 


内 存 块 。 这 些 内 存 块 可 以 是 非 零 的 、 按 两 字 节 递 
增 的 、 最 多 稍 小 于 64KB ( 译 者 注 : 64X1024 字 ro 





节 ， 约 为 64 千 字 节 ) 的 任何 大 小 。 内 存 块 可 以 
按 任何 次 序 归 还 给 操作 系统 ， 并 可 通过 操作 系 
统 服务 调用 来 变 小 或 变 大 。 

内 存 块 随机 进行 分 配 和 释放 ， 且 大 小 可 以 
改变 。 如 果 要 变 大 ， 那 么 相关 的 内 存 块 可 能 不 
得 不 移 到 堆 中 的 另外 一 个 地 方 。 最 后 ， 这 一 过 
程 会 陷入 一 种 所 谓 外 部 碎片 化 (external frag- 
mentation) 的 情形 。 该 术语 描述 的 是 这 样 一 种 情 
形 ， 虽 然 存 在 空闲 可 用 的 内 存 块 ， 而 且 空闲 内 
存 总 量 足 以 满足 一 个 新 的 申请 ， 但 是 由 于 即便 
是 其 中 最 大 的 空闲 块 也 因 过 小 而 无 法 满足 对 应 
申请 ， 所 以 相关 内 存 申请 还 是 不 能 直接 得 到 满 
足 。 具 体 如 图 4-3 所 示 。 


非 易 失 性 内 存在 掉 电 情况 下 不 会 丢失 其 内 容 。 







用 于 存放 变量 D 的 内 存 块 







空闲 的 16 字 节 内 存 块 
用 于 存放 变量 C 的 内 存 块 
空闲 的 16 字 节 内 存 块 ， 


用 于 存放 变量 E 的 内 存 块 


空闲 的 16 字 节 内 存 块 


尽管 这 个 堆 中 ， 总 共有 
96 字 节 的 空闲 空间 ， 但 由 
于 空闲 空间 被 碎片 化 了 ， 

所 以 我 们 无 法 满足 任何 大 
于 16 字 节 的 内 存 块 的 分 配 。 







用 于 存放 变量 B 的 内 存 块 
空闲 的 16 字 节 内 存 块 
用 于 存放 变量 A 的 内 存 类 

空间 的 16 字 节 内 存 所 
4-3 ”外 部 碎片 化 






日 ”。 堆 是 指 一 种 数据 结构 ， 其 中 的 内 存 按 需 进行 分 配 ， 且 没有 特定 顺序 或 次 序 。 
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当 这 种 情况 发 生 时 ， 操 作 系 统 将 尝试 通过 移动 当前 在 用 的 内 存 块 来 形成 连续 的 空闲 空 
间 。 碎 片 化 空间 的 这 种 重新 组 织 称 为 紧凑 (compaction )。 内 存 重 新 组 织 可 能 带 来 一 个 潜在 的 
问题 : 一 个 应 用 程序 已 经 分 配 获 得 相关 内 存 块 并 拥有 诸多 指向 这 些 内 存 块 的 指针 。 如 果 操 作 
系统 准备 移动 相关 数据 ， 则 必须 保证 该 应 用 程序 仍 能 够 访问 到 那些 数据 。 

考虑 到 内 存 空间 中 相关 内 存 块 的 这 种 移动 ， 所 以 被 占用 内 存 块 应 以 一 种 受 控 的 方式 进行 
访问 。 首 先 ， 数 据 是 被 相应 代码 间接 地 访问 而 非 直接 访问 的 。 如 果 那 样 ， 操 作 系统 就 可 以 在 
堆 中 移动 数据 ， 而 且 进 程 仍 能 够 通过 指针 访问 到 相应 数据 。 通 过 所 谓 的 主 控 指针 表 (〈 Master 
Pointer Table，MPT) 中 的 一 个 表 项 来 对 堆 中 的 每 个 内 存 块 进行 标记 。 主 控 指针 表 本 身 是 对 
应 堆 的 开始 位 置 的 一 个 随机 访问 存储 器 类 型 的 内 存 块 。 当 一 个 内 存 块 被 分 配 时 ， 应 用 程序 
并 未 被 赋予 指向 对 应 内 存 块 的 直接 的 指针 ， 而 是 获得 了 一 个 主 控 内 存 块 指 针 ( Master Chunk 
Pointer，MCP)。 该 指针 其 实 是 主 控 指针 表 中 对 应 于 该 内 存 块 的 指针 的 偏 移 地 址 ， 如 图 4-4 
所 示 。 


主 控 指针 表 中 的 偏 移 地 址 堆 空 间 










应 用 程序 中 对 应 于 
变量 A 的 指针 实际 上 
是 主 控 指针 表 中 对 应 
于 变量 A 的 表 项 的 偏 
移 地 址 


图 4-4 ” 主 控 指针 表 


关于 内 存 受 控 访 问 的 第 二 个 方面 是 指 ， 应 用 程序 在 使 用 一 个 内 存 块 之 前 必须 先 将 其 锁 
定 (lock， 或 称 之 为 加 锁 )。 当 应 用 程序 想 要 使 用 内 存 块 中 的 数据 时 ， 其 调用 操作 系统 来 
锁定 对 应 于 该 内 存 块 的 主 控 内 存 块 指针 。 鉴 于 操作 系统 为 每 个 内 存 块 维护 着 一 个 相应 的 
加 锁 计数 器 ， 所 以 操作 系统 将 就 该 内 存 块 的 加 锁 计数 器 做 加 1 操作 (最 大 值 为 16 )， 然 后 
把 该 内 存 块 的 当前 物理 地 址 返回 给 应 用 程序 。 于 是 ， 应 用 程序 就 能 够 根据 需要 对 该 内 存 
块 进行 访问 了 。 当 应 用 程序 结束 内 存 块 的 使 用 时 ， 其 应 当 为 该 内 存 块 解锁 ， 这 时 操作 系 
统 将 对 相应 的 加 锁 计 数 器 做 减 1 操作 。 当 操作 系统 需要 执行 紧凑 操作 时 ， 其 并 不 会 移 
动 被 应 用 程序 锁定 的 那些 内 存 块 ， 因 为 加 锁 意味 着 有 关 的 应 用 程序 正在 使 用 着 相应 的 
数据 。 

每 个 控制 着 一 个 特定 的 堆 的 主 控 指 针 表 还 包含 有 一 个 指针 ， 以 指向 下 一 个 可 能 的 主 控 指 
针 表 。 如 果 第 一 个 主 控 指 针 表 填充 满 了 ， 将 会 从 堆 中 分 配 得 到 第 二 个 主 控 指 针 表 ， 同 时 第 一 
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个 主 控 指 针 表 将 会 指向 第 二 个 主 控 指针 表 。 图 4-5 和 图 4-6 举例 说 明了 相关 概念 9。 
碎片 收集 前 的 堆 空 间 碎片 收集 后 的 推 空间 


空闲 的 16 字 节 内 存 块 “| | 用 于 存放 变量 E 的 内 存 块 


用 于 存放 变量 D 的 内 存 块 | | 用 于 存放 变量 D 的 内 存 块 


空间 的 16 字 节 内 存 块 。| | 用 于 存放 变量 A 的 内 存 块 

移动 当前 未 被 
用 于 存放 变量 C 的 内 存 块 | | 用 于 存放 变量 C 的 内 存 块 | 锁 宇 的 在 用 内 
空闲 的 16 字 节 内存 块 


用 于 存放 变量 E 的 内 存 块 | | 空闲 的 48 字 节 内 存 块 
空闲 的 16 字 节 内 存 块 





























用 于 存放 变量 B 的 内 存 块 | | 用 于 存放 变量 B 的 内 存 块 


空闲 的 16 字 节 内 存 块 
空闲 的 48 字 节 内 存 块 


用 于 存放 变量 A 的 内 存 块 
图 4-5 碎片 收集 
4.4.3 不 可 移动 的 内 存 块 堆 空 间 


一 些 内 存 块 是 不 能 被 移动 的 ， 例 如 程序 代码 。 不 可 移动 的 
内 存 块 是 从 堆 的 高 端 (高 端 内 存 地 址 ) 起 进行 分 配 的 ， 而 可 移 
动 的 内 存 块 则 是 从 堆 的 前 端 ( 低 端 内 存 地 址 ) 起 进行 分 配 的 。 
在 主 控 指 针 表 中 无 须 为 不 可 移动 的 内 存 块 设立 表 项 ， 因 为 主 控 | … | 
指针 表 的 唯一 目的 就 是 方便 紧凑 过 程 中 内 存 块 的 移动 操作 。 为 


锁定 ， 所 以 其 
并 没有 被 移动 。 












保持 一 致 ， 甚 至 连 只 读 存储 器 都 要 通过 “内 存 块 表 ” 来 进行 访 
问 。 这 样 就 可 以 支持 一 个 应 用 程序 在 随机 访问 存储 器 中 进行 调 
试 后 ， 不 经 修改 就 能 够 移动 到 只 读 存储 器 中 。 鉴 于 只 读 存储 器 

中 的 代码 按照 定义 是 不 可 被 移动 的 ， 所 以 在 主 控 指针 表 中 并 不 

会 为 只 i 设立 相 后 

会 为 只 读 存储 器 中 的 堆 设立 相应 的 主 控 内 存 块 指针 pp re 


4.4.4 ”空闲 空间 监测 


在 堆 最 初 由 操作 系统 创建 的 时 候 ， 内 存 管理 软件 会 创建 空 的 主 控 指针 表 。 如 前 所 述 ， 可 
移动 的 内 存 块 是 从 堆 的 前 端 起 进行 分 配 的 ， 而 不 可 移动 的 内 存 块 是 从 堆 的 后 端 起 进行 分 配 
的 。 两 者 之 间 的 区 域 被 认为 是 空闲 的 内 存 。 当 应 用 程序 有 一 些 内 存 块 不 再 需要 的 时 候 ， 它 们 7 
就 会 调用 操作 系统 来 释放 对 应 的 内 存 块 。 被 释放 的 内 存 块 被 标记 为 是 空闲 的 ， 并 会 在 需要 的 |79 
情况 下 被 再 次 分 配给 相应 的 应 用 程序 。 如 果 所 提出 的 是 一 个 关于 较 小 内 存 容 量 的 请 求 ， 那 么 
一 个 较 大 的 内 存 块 将 被 分 割 成 两 个 部 分 ， 一 部 分 分 配给 对 应 数据 ， 而 另 一 部 分 标记 为 空闲 
(未 使 用 )。 这 便 造 成 了 堆 的 碎片 化 。 但 是 ， 操 作 系统 是 如 何 决定 针对 哪个 空闲 的 内 存 块 来 进 


日 ”这 种 机 制 看 起 来 十 分 复杂 ， 而 且 也 确实 复杂 。 然 而 ,这 是 今天 的 许多 操作 系统 中 所 使 用 的 典型 的 内 存 访 
问 控制 机 制 ， 所 以 值得 详细 地 审视 和 研究 。 
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行 切 分 的 呢 ? 它 会 选择 一 个 满足 要 求 的 最 小 的 空闲 内 存 块 呢 ? 还 是 选择 查找 过 程 中 发 现 的 
第 一 个 足够 大 和 可 以 满足 要 求 的 空闲 内 存 块 呢 ? 相关 策略 分 别 被 称 为 “最 佳 适应 分 配 策略 ” 
和 “首次 适应 分 配 策略 "， 还 有 其 他 的 一 些 分 配 策略 ， 所 有 这 些 将 会 在 第 10 章 中 展开 进一步 


讨论 。 


4.5 文件 支持 


在 较为 传统 的 操作 系统 中 ,文件 系统 通过 调用 操作 系统 把 单个 的 文件 记录 从 辅助 存储 器 
读 取 到 主 存 中 。 应 用 程序 将 会 在 主 存 中 对 数据 进行 操作 ， 如 果 需 要 ， 应 用 程序 还 会 再 次 通过 
调用 操作 系统 把 数据 写 回 到 辅助 存储 器 。 在 Palm 系统 的 设计 中 ， 正 常情 况 下 并 没有 辅助 存 
储 器 。 所 有 的 数据 都 保存 在 主 存 的 存储 部 分 ， 或 者 是 闪存 ， 或 者 是 随机 访问 存储 器 。 考 虑 到 
大 多 数 程序 设计 人 员 都 会 对 文件 和 记录 的 概念 怀 有 浓厚 的 兴趣 ， 所 以 在 Palm 操作 系统 中 也 
保持 了 这 种 取向 。 存 储 型 随机 访问 存储 器 被 作为 某 种 类 型 的 辅助 存储 器 来 进行 使 用 。 正 如 前 
面 所 提 到 的 那样 ， 存 储 型 随机 访问 存储 器 的 内 容 永远 不 会 被 清除 掉 ， 即使 是 在 系统 被 关闭 的 
情况 下 。 


4.5.1 数据 库 和 记录 


数据 以 记录 (record) 方式 进行 保存 。 例 如 ， 一 条 记录 可 能 对 应 一 部 通讯 德 中 的 一 个 联 
系 人 的 联系 信息 。 每 条 记录 存放 在 一 个 内 存 块 中 。 相 关内 存 块 被 聚集 到 一 起 而 形成 的 集合 称 
为 数据 库 (database)。( 这 些 数 据 库 是 指 在 大 多 数 操作 系统 中 的 所 谓 的 “文件 ” 。 它 们 并 不 是 
当 我 们 通常 使 用 “数据 库 ” 这 个 词 的 时 候 所 指 的 那个 意思 ， 即 拥有 包括 自动 对 数据 进行 索引 
等 功能 在 内 的 一 个 系统 。) 每 个 数据 库 都 有 一 个 首部 (header)。 该 首部 包含 了 数据 库 的 一 些 
基本 信息 以 及 数据 库 的 记录 列表 。 此 记录 列表 实际 上 只 是 各 记录 的 唯一 标识 符 的 列表 。 如 果 
最 初 的 包含 了 记录 标识 符 列表 的 内 存 块 已 满 ， 则 会 分 配 男 一 个 首部 内 存 块 ， 同 时 将 第 一 个 首 
部 内 存 块 指向 第 三 个 首部 内 存 块 。 相 关 标 识 符 只 是 在 单个 的 内 存 卡 的 地 址 空间 内 是 唯一 的 ， 
因此 ， 对 于 一 个 给 定 的 数据 库 的 所 有 记录 都 必须 存放 在 一 个 单一 的 内 存 卡 中 。 虽 然 记 录 标 识 
符 只 是 一 个 整数 ， 与 对 应 数据 并 无 任何 关系 ,但 是 也 有 可 能 在 每 个 数据 库 记 录 中 创建 一 个 可 
以 被 程序 搜索 的 关键 字 字段 。 

在 一 些 数据 存储 空间 受 限 的 〈 非 Palm 的 ) 系统 中 ， 数 据 可 能 被 压缩 以 节省 空间 。 不 过 ， 
由 于 Palm 操作 系统 平台 的 处 理 器 的 处 理 能 力 不 算 太 强 ， 所 以 相关 信息 往往 并 没有 被 存储 成 
压缩 格式 。 当 辅助 存储 器 是 在 如 磁盘 之 类 的 一 个 旋转 式 存储 器 的 情况 下 ， 应 用 程序 提出 记录 
请 求 的 时 间 和 硬件 可 以 访问 数据 的 时 间 之 间 往 往 会 存在 一 定 的 时 延 (time lapse， 或 latency， 
即 延迟 )。 该 延迟 时 间 常 常 可 以 抵消 完成 压缩 操作 和 解压 缩 操作 所 需 的 时 间 。 鉴 于 在 Palm 操 
作 系 统 平 台 上 通常 没有 旋转 式 存储 器 ， 数 据 获取 几乎 不 需要 时 间 ， 所 以 用 于 压缩 处 理 的 任何 
时 间 将 对 用 户 是 可 见 的 。 为 此 ， 正 常情 况 下 ，Palm 操作 系统 不 会 使 用 压缩 处 理 。 


4.5.2 资源 对 象 


在 图 形 化 用 户 界面 中 ， 包 含有 诸如 按钮 、 文 本 框 、 滑 动 条 控件 等 许多 出 现在 屏幕 上 的 
元 素 。Palm 操作 系统 把 图 形 化 用 户 界 面 的 各 式 各 样 的 元 素 定 义 为 对 象 ( object)， 称 之 为 资 
源 (resource)。 这 些 资源 不 是 传统 意义 上 的 对 象 ， 而 只 是 数据 结构 。 每 个 资源 都 有 一 个 特定 
的 结构 ， 以 便 操 作 系统 可 以 某 些 默认 的 方式 对 其 进行 处 理 。 例 如 ， 如 果 一 个 应 用 程序 要 显示 
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关于 一 条 记录 被 删除 的 确认 式 警 示 ， 它 仅仅 需要 定义 相应 警报 ， 然 后 调用 操作 系统 来 显示 它 
即 可 。 图 4-7 显示 了 这 样 一 个 警报 框 。 当 显示 警报 时 ， 操 作 系 统 
将 会 保存 即将 显示 对 应 警报 的 下 面 一 层 的 那个 窗口 并 更 新 窗 体 上 | 
的 窗口 ， 以 便 用 户 看 到 警报 。 在 用 户 确 认 该 警报 后 ， 操 作 系 统 将 | 
把 所 保存 的 窗口 还 原 回 窗 体 上 ， 并 把 用 户 在 警报 框 上 所 选择 的 按 
钮 告诉 应 用 程序 。 应 用 程序 可 以 始终 不 理会 默认 操作 ， 并 触发 一 【一 一 

些 特殊 的 活动 。 这 些 资源 就 像 数 据 库 记 录 一 样 被 保存 在 内 存 块 中 ， 图 4-7 一个 警报 框 窗 体 
并 被 操作 系统 进行 了 标记 ， 以 方便 操作 系统 弄 清楚 每 个 对 象 表示 

的 是 什么 类 型 的 资源 。 


4.5.3 ”辅助 存储 器 


我 们 曾 提 到 过 ， 在 Palm 操作 系统 平台 上 通常 没有 辅助 存储 器 。 从 大 多 数 应 用 程序 的 观 
点 来 看 ， 这 是 正确 的 。 然 而 ， 在 小 型 手持 式 设备 领域 的 其 他 方面 的 发 展 却 带 来 了 关于 更 通用 
的 存储 机 制 的 要 求 。 从 Palm 操作 系统 发 行 版 4.0 起 ， 便 开始 引入 一 种 不 同类 别 的 内 存 设 备 
的 支持 。 相 关 设 备 被 认为 是 采用 了 常见 的 辅助 存储 器 设备 的 比较 典型 的 组 织 方式 。 一 种 流行 
的 模型 应 运 而 生 ， 这 些 设备 模仿 DOS 磁盘 驱动 器 上 可 以 见 到 的 文件 系统 的 方式 来 进行 初始 
化 。 相 关 部 件 的 期 望 的 用 途 是 ， 先 被 男 一 个 设备 (如 一 台 个 人 计算 机 ) 写 人 信息 ， 然 后 插入 
Palm 操作 系统 的 硬件 装置 上 来 开展 后 续 的 访问 。 用 户 可 能 在 个 人 计算 机 上 保存 了 好 多 文件 ， 
而 把 个 别 文件 加 载 到 内 存 部 件 上 ， 以 便于 今后 插入 Palm 系统 上 进行 访问 。 为 了 使 个 人 计算 
机 无 须 特别 的 软件 来 访问 常规 的 Palm 系统 的 内 存 部 件 ， 于 是 采用 了 一 种 已 经 得 到 许多 操作 
系统 支持 的 文件 组 织 方 式 。 考 虑 到 微软 操作 系统 无 处 不 在 的 客观 现实 情况 ， 几 乎 所 有 现在 的 
操作 系统 都 支持 可 拆 印 的 辅助 存储 器 设备 所 用 到 的 那些 文件 格式 。 


4.6 基本 输入 /输出 
隐藏 硬件 细节 


Palm 操作 系统 贯彻 这 样 的 设计 理念 ， 即 让 相应 系统 在 程序 设计 人 员 看 来 尽 可 能 多 地 与 
传统 的 计算 机 系统 别 无 两 样 。 这 方面 的 一 个 很 好 的 例子 是 关于 用 户 输入 的 处 理 。 正 常情 况 
下 ， 一 个 操作 系统 会 隐藏 用 户 键盘 输入 的 许多 细节 。 一 般 来 说 ， 至 少 会 有 两 个 层级 的 抽象 : 

1 ) 一 些 程序 希望 看 到 每 一 次 按键 操作 。 像 UNIX 文本 编辑 程序 vi 之 类 的 全 屏幕 文本 编 
辑 器 就 是 很 好 的 例证 。 此 类 应 用 程序 解释 每 一 次 按键 操作 ， 从 而 使 其 仅仅 通过 有 限 的 几 个 按 
键 就 能 够 实现 非常 强大 的 编辑 命令 。 这 被 称 为 原生 接口 (raw interface)。 

2 ) 第 二 个 抽象 层级 可 用 于 只 1 要 求 按 读 取 一 整 行 来 进行 输入 的 应 用 程序 。 伴 随 用 户 输入 
每 一 行 ， 操 作 系 统 会 提供 相应 行 的 各 式 各 样 的 编辑 操作 ， 包 括 字 符 或 字符 串 的 插入 或 删除 、 
前 一 行 的 复制 、 退 格 、( 在 打 错 字母 上 的 ) 重 打 ， 等 等 。 对 应 程序 只 会 见 到 完整 的 输入 行 。 
这 被 称 为 熟 式 接口 (cooked interface)。 

习惯 用 C 编写 程序 的 程序 设计 人 员 都 知道 ,“ 熟 式 ”的 键盘 接口 体现 为 stdin (标准 输入 ) 
功能 。C 库 通 常 还 为 打印 机 输出 提供 了 一 个 所 谓 stdout (标准 输出 ) 的 “ 熟 式 ” 风 格 的 接口 ， 
为 错误 报告 提供 了 一 个 相 类 似 的 所 谓 stderr (标准 错误 ) 的 输出 接口 。 起 先 ， 相 关 的 输出 流 
被 设计 成 直接 传送 到 硬 拷贝 打印 机 上 ， 但 后 来 ， 有 关 实 现 变 成 了 常常 把 stdout 定向 到 终端 屏 
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幕 而 非 真 实 的 打印 机 上 。Palm 操作 系统 的 相关 功能 与 此 类 似 ， 提 供 了 所 有 这 三 种 接口 。 当 
然 ， 关 于 手持 式 硬 件 的 独特 之 处 在 于 其 正常 情况 下 并 没有 键盘 ， 这 一 点 增强 了 相关 抽象 的 效 
用 。 用 户 可 以 使 用 触 控 笔 在 手持 式 显示 器 屏幕 上 选择 字符 图 标 ， 就 像 键盘 输入 方式 一 样 ， 或 
者 在 涂鸦 区 书写 自由 形式 的 字符 。 操 作 系统 隐藏 了 所 有 这 些 细 节 ， 人 允许 一 个 C 语言 编写 的 
程序 使 用 stdin 而 不 用 关心 那些 背后 的 实现 细节 ， 接 受 一 个 完整 的 输入 行 而 不 用 担心 其 具体 
的 实际 输入 方式 。 当 一 套 真 实 的 键盘 连接 到 手持 式 装 置 上 时 ， 其 将 允许 用 户 通过 按键 来 输入 
命令 ， 而 且 应 用 程序 永远 不 会 意识 到 其 间 的 不 同 。 


4.7 显示 管理 
4.7.1 相应 硬件 


标 配 显示 器 是 触摸 敏感 式 液晶 面板 ， 分辨 率 为 160X 160 像素 (图片 元 素 或 点 )， 高 分 辩 
率 显示 器 可 达 480X320 像素 。 最 初 的 模型 只 是 白 底 黑 字 ,但 后 来 的 模型 可 以 支持 四 级 灰 度 
显示 。 更 新 的 模型 则 能 够 显示 彩色 ,具体 为 2 种 、4 种 、64 种 、256 种 或 65 K 种 颜色 。 就 
像 早期 的 个 人 计算 机 一 样 ， 其 屏幕 是 直接 从 内 存 提取 相关 内 容 来 进行 刷新 的 ， 而 并 非 一 件 必 
须 通 过 输入 /输出 指令 来 进行 写 人 的 设备 。 考 虑 到 实际 的 显示 器 在 不 断 地 更 新 换代 ， 所 以 强 
烈 建 议 应 用 程序 把 硬件 细节 抛 给 操作 系统 去 进行 处 理 ， 而 通过 使 用 标准 的 系统 调用 来 访问 显 
示 器 。 这 是 操作 系统 所 做 的 一 种 代表 性 的 抽象 ， 目 的 是 使 应 用 程序 无 须 处 理 硬件 细节 ， 从 而 
具有 更 好 的 可 移植 性 。 


4.7.2 ”高 级 图 形 化 用 户 界面 元 素 


Palm 操作 系统 拥有 一 套 基 于 窗 体 ( form) 概念 的 图 形 化 用 户 界面 。 这 些 窗 体 类 似 于 支 
持 图 形 化 用 户 界面 的 其 他 操作 系统 中 的 所 谓 的 窗口 (window)， 不 同 之 处 在 于 它们 常常 会 填 
满 整个 屏幕 。 一 个 窗 体 通常 是 指 应 用 程序 数据 的 某 一 部 分 的 视图 。 例 如 ， 地 址 夭 应 用 程序 可 
能 有 一 个 窗 体 用 于 查看 地 址 列表 ， 还 有 一 个 窗 体 用 于 编辑 单个 地 址 ， 等 等 。 操 作 系统 还 支持 
一 个 称 为 窗口 的 元 素 , 不过， 这 时 的 术语 窗口 指 的 是 一 个 可 以 通过 系统 的 绘图 功能 在 上 面 进 
行 操作 的 对 象 。 有 的 窗口 可 能 并 不 是 窗 体 ， 而 是 用 来 创建 对 话 框 等 。 但 所 有 的 窗 体 都 是 窗 
口 。 在 大 多 数 情况 下 ， 应 用 程序 并 不 会 直接 在 窗口 上 进行 绘制 。 所 有 的 操作 将 基于 按钮 、 菜 
单 等 图 形 化 用 户 界面 元 素 ， 或 应 用 程序 所 做 的 系统 调用 来 进行 实施 。 进 一 步 说 ， 操 作 系统 应 
支持 按钮 的 绘制 及 用 户 点 击 按钮 操作 的 具体 处 理 ; 而 应 用 程序 仅仅 需要 在 按钮 上 定义 标签 ， 
并 告诉 操作 系统 在 窗 体 上 放置 按钮 的 具体 位 置 以 及 当 用 户 触摸 屏幕 上 的 按钮 时 应 提供 给 该 应 
用 程序 的 特定 数字 编码 。 该 数字 编码 将 作为 事件 提交 给 应 用 程序 。 另 外 ， 如 果 应 用 程序 想 支 
持 动画 或 想 定义 自己 的 操作 系统 所 没有 提供 的 其 他 图 形 化 用 户 界面 元 素 时 ， 其 唯 有 使 用 低级 
的 绘图 功能 。 在 Palm 操作 系统 中 ， 这 些 应 用 程序 特有 的 图 形 化 用 户 界面 元 素 被 称 为 小 工具 
(gadget) 或 对 象 (object)。( 在 其 他 操作 系统 中 ， 它 们 又 常常 被 称 为 小 部 件 ， 即 widget。) 它 
们 并 不 对 应 程序 设计 中 所 用 的 术语 “对 象 " ， 而 只 是 指 可 能 拥有 与 事件 相关 联 的 特定 子 程序 
的 数据 结构 。 相 关 事件 包括 完成 某 区 域 绘制 、 点 击 屏幕 上 某 窗 体 的 按钮 等 。 


4.7.3 ”特殊 的 窗 体 类 型 
有 两 种 特殊 类 型 的 窗 体 无 须 填 满 整个 屏幕 ， 警 报 框 (alert box) 是 其 中 之 一 。 一 种 常见 
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的 警报 框 可 能 是 关于 一 条 记录 删除 的 确认 ， 如 图 4-7 所 示 。 和 警报 框 由 应 用 程序 控制 显示 。 应 
用 程序 要 求 相 应 警报 框 一 直 持 有 焦点 ， 除 非得 到 用 户 对 该 警报 框 的 确认 。 这 种 窗 体 被 称 为 模 
态 窗 体 ( modal form)。 在 某 些 情况 下 ， 只 有 一 个 唯一 的 按钮 ， 且 用 户 必须 点 击 该 按钮 才 可 
以 实现 对 相应 警报 框 的 确认 。 在 如 图 4-7 所 示 的 例子 里 有 两 个 按钮 ， 用 户 可 以 通过 和 触 控 笔 具 
体 选择 其 中 的 一 人 个。 之后， 操作 系统 就 会 从 屏幕 上 移 除 该 警报 框 。 这 种 窗 体 的 另外 一 个 特殊 
的 地 方 是 ， 不 要 求 应 用 程序 特别 地 来 创建 具体 的 窗 体 一 一 而 仅仅 需要 对 定义 了 (出 现在 警报 
框 及 按钮 上 的 ) 文本 的 相关 结构 进行 设置 ， 并 请 求 操作 系统 来 创建 警报 框 。 操 作 系 统 将 处 理 
包括 点 击 按钮 之 类 的 所 有 事件 。 

第 二 种 特殊 的 窗 体 是 进度 对 话 框 ( progress dialog)。 这 种 窗 体 类 似 于 警报 框 ， 但 具有 较 
强 的 动态 性 。 其 主要 用 于 当 一 个 应 用 程序 正在 完成 比较 耗 时 的 处 理 (如 文件 传输 等 ) 的 场合 。 
应 用 程序 可 以 通过 一 个 相对 独立 的 调用 来 改变 当前 正在 显示 的 具体 内 容 。 一 般 情况 下 ， 会 是 
关于 应 用 程序 进度 的 一 个 指示 器 。 如 果 某 应 用 程序 正在 发 送 一 个 100KB 大 小 的 文件 且 已 经 
发 送 了 50KB ， 则 可 能 会 画 一 根 长 条 ， 且 着 色 该 长 条 50% 的 部 分 。 这 便 可 以 清楚 明了 地 提醒 
用 户 还 需 多 长 时 间 才 能 完成 相应 操作 。 其 间 ， 通 常 有 一 个 按钮 可 供用 户 点 击 ， 壁 如 关于 取消 
操作 的 按钮 。 监 控 按钮 点 击 是 操作 系统 为 应 用 程序 提供 的 实时 任务 类 服务 之 一 ， 其 不 会 中 断 
应 用 程序 的 正常 流程 ， 但 却 能 够 对 按钮 操作 事件 提供 及 时 的 响应 。 这 将 有 助 于 把 应 用 程序 从 
不 得 不 时 时 检查 按钮 点 击 的 困 局 中 解脱 出 来 ， 进 而 专心 致力 于 正常 的 处 理事 务 。 


4.7.4 低级 图 形 化 用 户 界面 控件 


Palm 操作 系统 的 图 形 化 用 户 界面 的 控件 不 是 传统 意义 上 的 对 象 。 它 们 没有 方法 或 属性 ， 
而 仅仅 是 数据 结构 。 对 于 给 定 类 型 的 控件 而 言 ， 有 各 种 不 同 的 操作 系统 调用 可 以 用 来 触发 它 
们 的 显示 。 当 用 户 触摸 到 屏幕 上 的 一 个 控件 时 ， 将 会 生成 一 个 事件 并 被 传递 给 应 用 程序 。 该 
应 用 程序 将 会 接收 事件 并 执行 相应 的 代码 。 

表 4-2 给 出 了 Palm 操作 系统 所 支持 的 控件 、 相 关 例 子 以 及 关于 某 些 控件 的 一 些 具体 说 
明 信 息 。 





表 4-2 Palm 操作 系统 所 支持 的 控件 


系统 定义 的 控件 

控件 名 称 详细 信息 
按钮 触发 某 项 功能 或 调用 某 个 函数 (如 “显示 ”) 
按键 式 按钮 如 单 选 按钮 : 
关于 选择 器 的 触发 器 用 于 打开 一 种 专门 的 对 话 框 (如 用 于 输入 日 期 的 对 话 框 ) 
增 量 式 箭头 用 于 改变 对 应 关联 控件 里 的 数值 
复 选 框 真 / 假 一 一 打开 /关闭 
弹出 式 列表 由 弹出 式 触发 器 激活 和 打开 
弹出 式 触 发 器 用 于 打开 弹出 式 列表 (标记 为 向 下 的 三 角形 更) 
列表 下 拉 式 列表 (如 菜单 上 的 下 拉 式 列表 ) 
菜单 用 于 访问 不 常 使 用 的 功能 
文本 框 基本 的 数据 输入 框 


滚动 条 当 数 据 溢出 窗 体 显示 区 域 时 使 用 


[83 | 


[84 | 


556。 钾 二 六 分 洲 浊 式 区 建 韦 作 夭 统 : 面向" 民 稳 顽 花 访 兴 


4.8 事件 驱动 的 程序 


在 Palm 操作 系统 上 ， 大 多 数 应 用 程序 都 编写 成 交互 执行 方式 。 它 们 一 般 不 会 像 主机 上 
的 工资 管理 应 用 程序 那样 处 理 批量 数据 ， 也 不 会 像 服务 器 那样 对 完整 的 独立 请 求 进行 响应 ， 
而 是 专注 于 用 户 的 即时 交互 式 输入 。 因 此 ， 这 些 应 用 程序 是 以 一 种 特殊 的 方式 组 织 起 来 的 。 
当 一 个 Palm 应 用 程序 运行 时 ， 其 首先 初始 化 相关 文件 (如果 有 )， 然 后 就 进入 一 个 检查 事 
件 的 循环 。 在 该 循环 中 ， 它 会 检查 和 处 理由 操作 系统 传 给 它 的 各 类 事件 。 具 体例 子 如 图 4-8 
所 示 。 


static void EventLoop (void) 


UInt16 error; 
EventType event; 
do 


EvtGetEvent (&event, evtWaitForever); 
PreprocessEvent (&event); 
if(! SysHandleEvent (&event)) 
if(! MenuHandleEvent (NULL, &event, &error)) 
if(! ApplicationHandleEvent (&event)) 
FrmDispatchEvent (&event); 


#ifEMULATION LEVEL != EMULATION NONE 
ECApptDBValidate (ApptDB); 
#endif 


while (event .eType != appStopEvent); 





图 4-8 一 个 事件 驱动 的 程序 的 主 循环 


如 果 程 序 没 有 事件 需要 处 理 ， 就 会 告诉 操作 系统 要 等 待 事件 的 发 生 。 当 下 一 个 事件 发 生 
时 ,操作 系统 将 把 相关 信息 作为 检查 各 类 事件 的 一 个 函数 调用 的 返回 传递 给 该 应 用 程序 。 举 
例 来 说 ,假设 某 用 户 已 经 启动 了 应 用 程序 来 准备 完成 某 项 特定 的 任务 一 一 比如 说 是 在 通讯 簿 
文件 中 查找 一 个 电话 号 码 。 该 程序 将 无 事 可 做 而 只 有 等 待 ， 直 到 用 户 交 给 它 一 项 具体 的 任 
务 。 用 户 使 用 菜单 和 窗 体 里 的 其 他 控件 来 告诉 应 用 程序 去 完成 什么 任务 ， 有 可 能 是 一 个 文本 
框 中 输入 一 个 名 字 。 于 是 ， 伴 随 每 个 字符 的 输入 ， 该 应 用 程序 将 不 断 地 接收 到 一 个 个 事件 信 
号 ， 进 而 持续 更 新 显示 结果 以 反映 所 输入 的 名 字 。 

对 于 窗 体 中 定义 的 许多 控件 而 言 ， 应 用 程序 将 能 够 指定 所 采取 的 相关 动作 ， 这 样 操 作 系 
统 就 可 以 在 没有 应 用 程序 介入 的 情况 下 完成 大 量 的 工作 。 例 如 ， 操 作 系 统 知道 如 何 对 带 有 增 
量 式 箭头 的 控件 里 的 数值 进行 自动 地 递增 操作 。 对 于 其 他 的 按钮 而 言 ， 应 用 程序 则 可 能 需要 
完成 其 他 相应 特定 的 处 理 。 就 应 用 程序 定义 的 每 个 控件 来 讲 ， 当 控件 被 触及 时 ， 可 能 导致 相 
应 的 事件 编码 传递 给 应 用 程序 。 具 体 以 图 4-7 所 示 的 确认 式 对 话 框 的 例子 来 说 ， 当 该 控件 被 
显示 出 来 且 用 户 触及 其 中 一 个 按钮 时 ， 一 个 事件 将 会 被 发 送 给 应 用 程序 ， 且 发 给 应 用 程序 的 
数值 将 会 标示 出 对 应 发 出 事件 的 控件 以 及 被 点 击 的 按钮 。 

由 于 触摸 屏 的 操作 与 应 用 程序 之 间 是 异步 的 (也 就 是 说 ， 在 程序 运行 的 同时 ， 随 时 都 会 
发 生 触 屏 事 件 )， 而 且 不 少 事件 的 发 生 比 应 用 程序 对 它们 的 处 理 要 快 ， 所 以 操作 系统 必须 要 
维护 一 个 关于 已 经 发 生 但 尚未 交 给 应 用 程序 的 事件 的 队列 。 这 个 队列 按 优先 级 次 序 进行 维 
护 ， 从 而 使 相对 重要 的 事件 能 够 优先 得 到 应 用 程序 的 处 理 。 

一 些 此 类 的 事件 属于 系统 相关 的 事件 ， 例 如 ， 当 关闭 电源 (也 就 是 说 ， 系 统 即 将 进入 低 
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功 耗 睡眠 模式 ) 时 发 送 给 应 用 程序 的 事件 。 这 种 情况 下 ， 应 用 程序 将 会 暂缓 所 有 其 他 操作 ， 
如 与 其 他 系统 的 通信 等 。 


4.9 小 结 


” ”本章 中 ,我 们 讨论 了 一 种 简单 的 现代 操作 系统 一 一 由 Palm 公司 开发 的 Palm 操作 系 
统 一 一 的 特征 和 概念 。 这 种 操作 系统 是 针对 小 型 手持 设备 而 开发 的 。 尽 管 这 是 一 种 单 用 
户 系统 ， 但 其 可 以 并 发 执行 若干 操作 系统 进程 和 少量 的 应 用 程序 。 为 此 ， 它 支持 有 限 的 并 发 
执行 任务 ， 从 而 使 其 成 为 一 种 简单 的 多 任务 系统 。 

我 们 以 Palm 操作 系统 的 概要 介绍 来 开启 本 章 的 内 容 ， 然 后 讨论 了 使 用 Palm 操作 系统 
的 手持 式 计 算 机 的 一 些 独特 的 硬件 特性 。 这 些 与 众 不 同 的 特性 促成 了 Palm 操作 系统 设计 中 
所 做 的 一 些 决定 及 选择 方案 。 在 此 基础 上 ， 我 们 讨论 了 多 任务 的 本 质 ， 还 有 操作 系统 是 如 何 
运作 和 调度 应 用 程序 进程 及 操作 系统 任务 的 。 紧 接着 ,我 们 讨论 了 内 存 管 理 以 及 操作 系统 所 
支持 的 不 同类 型 的 内 存 存储 器 。 由 于 Palm 平台 通常 并 没有 硬盘 ， 而 是 使 用 所 谓 存储 型 随机 
访问 存储 器 的 内 存 的 一 部 分 来 保存 持久 性 数据 。 当 电源 关闭 时 ， 系 统 进入 睡眠 模式 ， 存 储 型 
随机 访问 存储 器 依然 保持 其 现 有 内 容 。 我 们 讨论 了 内 存 是 如 何 划分 为 内 存 块 的 ， 操 作 系 统 是 
如 何在 内 存 表 中 定位 不 同 的 内 存 块 以 及 如 何 使 用 紧凑 技术 来 管理 空闲 内 存 的 。 

随后 ， 就 Palm 操作 系统 中 的 文件 的 组 织 以 及 Palm 操作 系统 所 提供 的 基本 输入 /输出 功 
能 的 范畴 进行 了 概要 描述 。 后 者 涵盖 允许 用 户 以 手写 方式 输入 文本 的 涂鸦 式 输入 系统 。 我 
们 还 描述 了 显示 子 系统 和 简单 的 图 形 化 用 户 界面 程序 设计 ， 扼 要 讨论 了 面向 事件 的 程序 设 
计 一 一 大 多 数 Palm 应 用 程序 所 采用 的 程序 设计 范式 ， 另 外 还 介绍 了 Palm 操作 系统 中 典型 
的 应 用 程序 的 设计 要 领 。 

下 一 章 ， 我 们 将 继续 介绍 一 种 比 Palm 操作 系统 更 复杂 的 操作 系统 。 通 常情 况 下 ， 该 操 
作 系统 在 应 用 程序 层级 并 发 运行 多 个 程序 。 为 此 ， 该 操作 系统 相对 来 说 要 更 为 复杂 些 ， 且 包 
含 更 多 的 系统 开销 。 
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第 二 部 分 洲 进 式 欧 建 操作 夭 统 : 面向 广度 的 螺 论 式 方法 


习题 


4.1 
4.2 


4.3 
4.4 
4.5 
4.6 
4.7 
4.8 


4.11 


4.12 
4.13 


既然 Palm 处 理 器 任何 时 候 在 显示 器 上 只 能 有 一 道 程序 ， 为 什么 该 系统 还 需要 多 道 处 理 操作 系统 ? 
相对 于 现代 系统 而 言 ， 除 了 处 理 器 速度 缓慢 、 内 存 容量 非常 小 以 外 ， 什 么 是 Palm 操作 系统 所 基 
于 的 主要 硬件 设计 的 最 为 独特 的 部 分 ? 

Palm 操作 系统 是 微 内 核 还 是 整体 式 内 核 ? 

为 什么 Palm 操作 系统 要 采用 实时 内 核 ? 

大 多 数 Palm 应 用 程序 的 基本 浊 辑 流程 是 怎样 的 ? 

为 什么 分 配给 进程 的 内 存 是 间接 地 通过 主 控 指 针 表 来 进行 访问 的 ? 

Palm 操作 系统 是 如 何 对 空闲 内 存 进行 监测 的 ? 

正如 在 大 量 的 信息 系统 技术 中 常见 到 的 那样 ，Palm 操作 系统 的 开发 者 们 也 对 一 些 非常 好 的 术语 
进行 重用 并 赋予 其 他 不 同 的 含义 。Palm 操作 系统 文档 在 提 到 “数据 库 ”( database) 时 ， 上 具体 指 的 
是 什么 意思 ? 

既然 Palm 系统 平台 并 没有 多 大 的 内 存 空间 ， 为 什么 通常 情况 下 Palm 系统 并 不 对 数据 库 采 取 压 缩 
措施 呢 ? 

Palm 操作 系统 为 程序 设计 人 员 提 供 了 关于 输入 /输出 的 若干 种 抽象 机 制 ， 从 而 使 应 用 程序 员 无 
须 顾 虑 硬件 细节 。 本 章 都 提 到 了 哪些 抽象 机 制 ? 

屏幕 是 基于 内 存 来 进行 映射 的 而 非 通过 输入 /输出 指令 来 进行 处 理 的 ， 为 此 ， 大 多 数 应 用 程序 会 
直接 把 数据 移送 到 内 存 中 的 屏幕 区 域 。 这 是 否 正确 呢 ? 

简要 描述 面向 事件 驱动 的 程序 设计 。 

应 用 程序 员 是 如 何 绘制 其 要 在 屏幕 上 显示 的 窗 体 的 ? 


| 第 S 章 


Operating Systems: A Spiral Approach 


单 用 户 多 任务 / 多 线程 操作 系统 





5.1 引言 


Mac 操作 系统 是 我 们 的 操作 系统 螺旋 式 演 化 案例 的 一 个 典范 ， 因 为 它 本 身 就 经 历 了 一 
系列 的 演变 和 发 展 。 其 一 开始 的 目标 是 成 为 一 个 人 们 可 负担 得 起 的 拥有 图 形 化 用 户 界面 的 个 
人 计算 机 的 操作 系统 。 在 当时 ， 这 是 颇具 创新 和 革命 性 的 。 当 然 也 有 其 他 系统 在 使 用 图 形 化 
用 户 界面 ， 但 相关 系统 一 般 都 极其 昂贵 。 而 且 ， 除 了 图 形 化 用 户 界面 之 外 ， 在 大 多 数 方面 ， 
Mac 操作 系统 的 第 一 个 版 本 都 不 如 第 4 章 所 讨论 的 Palm 操作 系统 那么 复杂 。 尽 管 如 此 ， 随 
着 时 间 的 推移 ， 来 自 其 他 系统 的 压力 导致 了 Mac 硬件 和 Mac 操作 系统 的 演变 ， 在 Mac 操作 
系统 发 展 轨迹 的 最 后 ， 其 功能 大 致 与 我 们 将 在 下 一 章 所 讨论 的 多 用 户 Linux 操作 系统 一 样 强 
大 。 二 者 的 不 同 之 处 在 于 ，Linux 操作 系统 从 一 开始 就 设计 成 支持 多 个 并 发 用 户 ， 并 且 由 此 
在 相应 结构 和 设计 方面 造成 二 者 之 间 的 一 些 显著 差异 。 因 此 ,我 们 把 Mac 操作 系统 作为 从 
Palm 操作 系统 (面向 资源 稀缺 的 平台 环境 ， 只 有 单个 用 户 ， 多 任务 但 没有 用 户 多 线程 ， 有 
限 的 屏幕 大 小 ， 没 有 辅助 存储 器 ) 过 渡 到 Linux 操作 系统 (面向 多 用 户 、 多 任务 、 多 线程 ， 
相关 环境 拥有 大 容量 的 辅助 存储 器 和 第 三 级 存储 器 ， 图 形 化 用 户 界面 支持 大 屏幕 和 重 谷 窗 
口 ) 的 中 间 步 又 来 展开 讨论 。 

鉴于 Mac 操作 系统 在 其 发 展 过 程 中 曾经 历 过 几 次 深刻 的 变革 ， 所 以 我 们 在 本 章 将 使 用 
不 同 于 其 他 的 螺旋 式 教学 章节 的 方法 来 对 其 进行 介绍 。 

在 这 一 章 中 ， 我 们 从 第 5.1 节 起 ， 首 先 概要 论述 Mac 操作 系统 及 其 原始 内 核 的 基础 结构 
相关 的 一 些 背景 知识 。 简 短 介绍 之 后 ， 将 会 在 第 5.3 节 一 直到 第 5.12 节 的 各 节 中 按照 Mac 
操作 系统 的 版 本 演化 依次 阐述 各 个 版 本 的 新 增 功能 和 特征 。 这 主要 是 考虑 到 ，Mac 操作 系统 
从 一 开始 的 简陋 版 本 一 一 大 多 数 功 能 也 就 比 CP/M 好 那么 一 点 一 一 起 家 ， 最 终 却 演 变 成 一 个 
功能 齐全 、 能 够 支持 多 个 用 户 和 多 个 进程 且 与 下 一 章 所 讨论 的 Linux 操作 系统 完全 趋同 的 现 
代 操 作 系 统 。 追 随 Mac 操作 系统 的 发 展演 化 过 程 本 身 就 是 一 个 微 螺 旋 方 法 。 其 间 ， 我 们 将 
在 XX 版 Mac 操作 系统 处 暂 告 收尾 ， 并 将 在 下 一 章 转向 阐明 男 一 种 系统 ， 即 Linux 操作 系统 。 
关于 X 版 Mac 操作 系统 ,我们 将 着 眼 于 让 其 和 当前 市 场 上 的 其 他 主要 个 人 计算 机 操作 系统 
联系 起 来 的 目的 ， 展 开 充分 但 简洁 的 介绍 。 最 后 ， 我 们 在 第 5.13 节 对 全 章 内 容 进行 归纳 
总 结 。 


5.2 Mac 计算 机 的 起 源 


1973 年 ， 一 款 名 为 阿尔 托 (ALTO) 的 创新 性 计算 机 系统 在 施乐 帕 洛 阿尔 托 研究 中 心 
( Xerox Palo Alto Research Center，Xerox PARC) 设计 成 功 。 这 种 计算 机 从 未 出 售 过 ， 但 是 
有 200 多 台 赠 送 给 了 大 学 和 其 他 的 研究 机 构 。 这 些 计算 机 以 大 约 每 台 32 000 美元 9 的 价格 构 
建 起 来 ， 其 中 包含 有 诸如 我 们 今天 所 知道 的 图 形 化 用 户 界面 的 先导 原型 等 创新 性 技术 、 一 种 


日 相当 于 2007 年 的 157 000 美元 。 
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以 太 网 和 一 个 鼠标 ， 等 等 。 而 后 来 的 一 款 系统 ， 即 Xerox Star (施乐 之 星 )， 也 包含 许多 相同 
的 功能 ， 不 过 其 零售 价 已 经 降 到 了 16 600 美元 9。 但 是 ， 这 对 于 一 台 仅 仅 设想 由 一 个 人 来 使 
用 的 计算 机 来 说 ,仍然 太 过 昂贵 ， 故 而 有 关系 统 并 没有 取得 商业 化 的 成 功 。 尽 管 如 此 ， 这 些 
系统 得 到 了 个 人 计算 机 业务 中 一 些 有 远见 车 识 的 先驱 的 关注 ,他 们 开始 生产 个 人 可 负担 得 起 
且 融 和 人 前述 理念 的 系统 。 史 带 夫 ，… 乔布斯 ( Steven Jobs) 就 是 其 中 的 一 位 先驱 者 ， 他 的 苹果 
电脑 系统 位 列 第 一 批 商业 化 成 功 的 个 人 计算 机 当中 。 

苹果 公司 首先 开发 出 了 Lisa ( 丽 莎 ) 计算 机 系统 ， 其 零售 价 为 10 000 美元 8。 就 像 施 乐 
之 星 一 样 ， 这 也 属于 一 件 商 业 化 失败 的 案例 。 然 而 苹果 公司 坚持 不 懈 ， 并 最 终 在 1984 年 推 
出 了 Mac 个 人 计算 机 ， 其 零售 价 为 2500 美元 9S8， 与 IBM PC 价格 相当 。 对 于 普通 人 来 说 ， 
Mac 比 Lisa 更 实惠 ， 而 且 有 关 图 形 化 用 户 界 面 使 其 成 为 一 个 非常 有 用 的 系统 ， 所 以 其 取得 
了 立竿见影 的 成 功 。 需 要 说 明 的 是 ，Maec 硬件 采用 了 Motorola 68000 系列 处 理 器 。 


5.3 Mac 操作 系统 一 一 第 1 版 系统 


Mac 操作 系统 的 初始 版 本 称 为 System 1 ( 即 第 1 版 系统 )。 第 1 版 系统 拥有 若干 项 当时 
的 操作 系统 的 典型 功能 和 特征 。 同 时 ， 由 于 其 图 形 化 用 户 界 面 ， 所 以 还 有 一 些 独 特 的 特点 。 


5.3.1 图 形 化 用 户 界 面 


第 1 版 系统 提供 了 一 个 桌面 、 一 个 鼠标 以 及 若干 窗口 、 图 标 、 菜 单 和 滚动 条 ， 如 图 5-1 
所 示 。 在 桌面 上 有 一 个 垃圾 箱 图 标 ， 可 用 来 删除 东西 ， 具 体操 作 是 拖 动 相应 东西 并 投放 到 该 
图 标 上 即 可 完成 删除 功能 。 这 些 都 是 现在 我 们 认为 理所当然 的 隐喻 和 功能 ， 然 而 在 当时 却 是 
颇具 创新 性 的 突破 。 与 Palm 操作 系统 不 同 ， 第 1 版 系统 设计 假定 有 关 屏 幕 足够 容纳 一 个 以 
上 的 窗口 ， 或 者 能 够 显示 桌面 以 及 一 个 未 占 满 整个 屏幕 的 窗口 。 屏 幕 只 有 黑色 和 白色 ， 且 只 
有 520X342 像素 的 分 辨 率 ， 所 以 图 形 功能 非常 有 限 。 然 而 无 论 如 何 ， 这 毕竟 是 一 个 图 形 化 
用 户 界面 ， 并 且 许 多 用 户 特别 是 初学 者 发 现 它 比 命令 行 界面 更 加 友好 。 在 这 里 ， 不 妨 将 其 与 
CP/M 中 的 命令 行 提示 比较 一 下 ， 后 者 只 会 显示 出 : 


A> 


然后 就 等 待 用 户 输 入 ， 而 且 没 有 给 出 任何 提示 来 说 明 要 做 什么 。 

图 形 化 用 户 界 面 可 能 是 关于 Mac 操作 系统 最 值得 注意 的 一 个 方面 ， 这 不 是 因为 它 的 想 
法 如 何 新 颖 或 者 它 做 得 如 何 出 类 拔 荃 ， 而 是 在 于 那些 不 必 非 得 支持 的 东西 。 进 一 步 说 ， 在 全 
世界 的 其 他 地 方 ， 操 作 系 统 通常 情况 下 都 是 从 原来 具有 命令 行 界面 的 传统 系统 (譬如 DEC、 
UNIX、IBM 等 ) 演变 而 来 ， 且 相关 应 用 程序 都 是 通过 在 称 为 命令 行 的 接口 上 输入 一 行 命令 
而 调用 的 独立 程序 。 这 些 接口 模拟 了 连接 到 计算 机 的 打字 机 的 工作 方式 ， 故 此 它们 都 是 围绕 
键盘 使 用 而 设计 的 ， 很 少 提供 甚至 没有 鼠标 支持 。 每 个 应 用 程序 团队 都 可 以 针对 特定 功能 自 
由 地 使 用 任何 他 们 所 期 望 的 按键 。 于 是 ， 为 了 调用 拼写 检查 功能 ， 一 个 字 处 理 程 序 可 能 使 用 
了 F7 按键 ， 而 另 一 个 电子 表格 程序 则 可 能 使 用 了 F12 键 。 更 为 糟糕 的 是 ， 在 大 多 数 应 用 领 
域 并 没有 占据 支配 地 位 的 软件 包 ， 因 此 ，WordPerfect 文字 处 理 程序 可 能 使 用 了 这 个 按键 来 


日 相当 于 2007 年 的 42 000 美元 。 
四 “几乎 相当 于 2007 年 的 21 000 美元 。 
全 ”相当 于 2007 年 的 5000 多 美元 。 
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启动 打印 功能 ， 而 像 WordStar 之 类 的 竞争 程序 则 可 能 会 对 同一 项 功能 使 用 另 一 不 同 的 按键 。 
对 于 每 个 单独 的 应 用 程序 而 言 ， 往 往 会 提供 键盘 模板 ， 以 标明 每 个 功能 键 在 单独 使 用 或 者 与 
Shift、CTRL 和 ALT 键 进行 任意 组 合 使 用 的 时 候 ， 用 来 完成 什么 样 的 功能 。 
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图 5-1 Mac 操作 系统 图 形 化 用 户 界面 

来 源 : 本 章 中 所 有 关于 Mac 操作 系统 的 屏幕 截图 都 是 采用 Mini vMac 模拟 器 (针对 早期 Mac 操作 系统 的 模拟 

器 ) 制作 的 。 该 模拟 器 可 以 登录 如 下 网 址 获取 : http://minivmac.sourceforge.net/ 

对 于 Mac 操作 系统 而 言 ， 不 存在 任何 前 面 遗 留 下 来 的 应 用 程序 。 从 一 开始 ， 其 就 为 打 
印 功 能 指定 了 一 个 按键 序列 ， 而 一 个 新 的 应 用 程序 没有 理由 背离 相应 的 指定 方案 。 于 是 , 苹 
果 公 司 可 以 实事 求 是 地 宣传 在 Mac 操作 系统 上 学 习 使 用 软件 的 方便 。 例 如 ， 假 设 一 个 用 户 
已 经 在 Mac 系统 上 掌握 了 字 处 理应 用 程序 ， 而 且 该 用 户 理解 电子 表格 工具 的 工作 机 理 ， 那 
么 该 用 户 将 能 够 很 轻松 地 在 Mac 系统 上 使 用 电子 表格 程序 ， 因 为 所 有 标准 功能 都 将 会 以 与 
字 处 理 程序 同样 的 方式 进行 调用 。 即 使 在 今天 ， 这 个 问题 仍然 存在 于 Windows 和 Linux 应 
用 程序 中 。 关 键 在 于 ， 人 们 不 应 当 低 估 有 关 向 下 兼容 ( backward compatibility， 或 称 为 向 后 
兼容 ) 要 求 的 影响 一 一 而 这 是 Mac 操作 系统 所 没有 的 。 


5.3.2 单 任务 


为 了 交付 普通 民众 能 够 买 得 起 的 产品 ， 早 期 的 Mac 系统 不 
得 不 在 非常 有 限 的 内 存 条 件 下 运行 ， 毕 竞 它 仍然 十 分 昂贵 。 鉴 于 
此 ， 苹 果 公司 的 开发 人 员 决定 据 弃 曾 经 在 Lisa 计算 机 上 所 使 用 
的 多 任务 功能 。 进 一 步 说 ， 即 便 一 个 应 用 程序 的 窗口 没有 占 满 整 
个 屏幕 ，Mac 操作 系统 最 初 也 不 允许 多 个 程序 同时 运行 ， 甚 至 对 
于 后 台 的 打印 功能 也 是 如 此 。 为 了 使 用 某 些 并 行 的 功能 ， 操 作 系 
统 包含 了 若干 桌面 附件 ， 其 中 包括 计算 器 、 闹 钟 、 系 统 控制 面板 
以 及 记事 本 ， 不 过 它们 都 进行 了 限制 ， 以 确保 不 会 占用 太 多 的 内 
存 。 准 确 地 说 ， 它 们 是 以 “设备 驱动 程序 ”方式 而 不 是 以 单独 的 
程序 实现 的 ， 并 且 可 以 打开 一 个 窗口 。 图 5-2 显示 了 以 前 的 计算 图 5-2 “计算 器 ”桌面 附件 
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器 样式 ， 不 言 而 喻 ， 以 今天 的 标准 来 看 确实 是 有 点 原始 。 图 5-3 则 给 出 了 以 前 的 控制 面板 ， 
其 能 够 支持 用 户 更 改 许多 系统 设置 。 有 关系 统 中 还 有 一 个 称 为 查找 器 的 应 用 程序 ， 用 于 在 系 
统 中 查找 文件 。 查 找 器 窗口 是 命令 处 理 器 ， 在 大 多 数 操作 系统 中 体现 为 一 个 命令 行 控制 台 ， 
故而 它 也 是 运行 其 他 程序 的 机 制 。 在 图 5-1 中 就 可 以 见 到 查找 器 窗口 。 第 1 版 系统 的 查找 器 
被 称 为 单一 应 用 程序 查找 器 。 由 于 一 次 只 运行 一 道 应 用 程序 (不 包括 桌面 附件 )， 所 以 没有 
必要 防止 一 道 程序 读 取 或 更 改 内 存 中 的 另 一 道 程序 ， 因 此 操作 系统 中 没有 相关 的 保护 设计 。 
第 1 版 系统 甚至 没有 采取 措施 来 保护 操作 系统 免 受 应 用 程序 的 影响 。 实 际 上 ， 当 时 能 够 使 用 
的 大 多 数 其 他 操作 系统 也 是 如 此 。 


a a tontrol Panel EE 





图 5-3 ”控制 面板 


5.3.3 ”辅助 存储 器 


与 第 3 章 所 讨论 的 CP/M 系统 一 样 ， 第 1 版 系统 的 程序 保存 在 单个 软盘 驱动 右上， 并 且 
epi lt tg 需要 强调 的 是 ， 早 期 Mac 系统 上 可 用 的 磁盘 系统 
多 一 个 足够 小 的 空间 ， 很 容易 就 能 够 找到 文件 ， 故 而 所 有 的 文件 都 被 保存 

一 个 单一 eh rie apt 

WO 
这 些 文件 夹 仅仅 是 一 种 模仿 。 具 体 而 言 ， 每 个 文件 目录 项 可 能 被 标 上 了 文件 夹 名 称 ， 并 且 系 
统 允许 用 户 查看 文件 夹 里 的 内 容 ， 其 实质 就 是 列 出 标记 有 该 文件 夹 名 称 的 所 有 文件 。 为 此 ， 
文件 夹 之 间 是 不 可 能 能 套 的 。 


5.3.4 ”内存 管理 


Mac 操作 系统 具有 单一 的 地 址 空间 ， 如 图 5-4 所 示 S。 这 种 体系 结构 被 认为 是 “平坦 型 
的 "， 其 意味 着 在 任何 时 候 任何 指令 都 可 以 直接 引用 所 有 的 内 存 。 在 那个 时 代 的 其 他 设计 则 
采用 了 更 为 复杂 的 方案 且 允 许 有 更 多 的 内 存 ( RAM)， 不 过 对 寻 址 进行 了 限制 ， 使 得 相关 程 
序 利用 任何 指令 只 能 寻 址 64KB 大 小 的 内 存 范围 。68000 处 理 器 具有 24 位 地 址 ， 支 持 16MB 
内 存 。 系 统 没有 内 存 保护 ， 故 而 任何 程序 都 可 以 修改 内 存 中 包括 操作 系统 本 身 在 内 的 任何 东 


日 ”Mac 操作 系统 的 最 初版 本 并 未 支持 多 进程 ， 后 来 才 引 入 多 进程 。 
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西 。 同 时 ， 应 用 程序 代码 也 运行 在 管理 程序 模式 ( supervisor mode， 或 称 为 管 态 ) 下 ， 所 以 
没有 指令 保护 机 制 来 对 应 用 程序 可 以 完成 的 事情 加 以 限制 。 另 外 ， 在 操作 系统 启动 时 ， 便 确 
定 了 地 址 空间 的 大 小 。 具 体 而 言 ， 内 存 的 最 低地 址 部 分 由 系统 分 区 ( system partition) 占用 ， 
这 一 区 域 包含 有 一 些 系 统 全 局 变量 ， 且 应 用 程序 按理 说 应 当 不 能 够 直接 访问 。 换 言 之 ， 应 用 
程序 应 当 通 过 操作 系统 应 用 程序 接口 来 读 取 和 操作 任何 系统 数据 。 然 而 实际 上 ， 由 于 没有 任 
何 内 存 保护 或 指令 保护 机 制 ， 所 以 没有 什么 能 够 阻止 应 用 程序 采取 捷径 和 直接 访问 相关 信 
息 。 在 个 人 计算 机 的 早期 ， 应 用 程序 编写 人 员 通 常会 采取 此 类 快捷 访问 方式 ， 并 试图 以 提升 
性 能 的 名 义 来 为 他 们 的 行为 做 出 解释 。 

应 用 程序 分 区 ( application partition) 从 内 存 的 最 高 地 址 向 下 进行 分 配 。 应 用 程序 分 区 的 
布局 如 图 5-5 所 示 。 具 体 而 言 ， 其 顶部 是 一 个 固定 大 小 的 数据 块 ， 称 为 A5 定位 区 (A5world)， 
包含 有 应 用 程序 的 静态 数据 和 一 些 关 于 应 用 程序 的 元 数据 。 之 所 以 如 此 命名 ， 主 要 是 考虑 
到 Mac 操作 系统 会 利用 指向 该 区 域 的 指针 来 对 处 理 器 的 A5 寄存 器 进行 加 载 ， 这 样 应 用 程序 
就 可 以 获悉 其 在 内 存 中 的 位 置 ， 并 且 能 够 通过 相对 于 A5 寄存 器 的 寻 址 来 访问 其 全 局 数据 。 
在 A5 定位 区 之 下 是 栈 ， 栈 的 “顶部 ”向 下 扩展 。 同 时 ， 扒 则 从 应 用 程序 分 区 的 底部 向 上 增 
长 ， 且 包含 有 代码 段 。 因 此 ， 操 作 系统 必须 要 解决 的 一 个 问题 就 是 确保 这 两 个 区 域 不 会 发 生 
重合。 


高 地 址 内 存 高 地 址 内 存 
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应 用 程序 
地 址 限 值 
系统 
分 区 
系统 全 局 变量 应 用 程序 基 址 
图 5-4 第 1 版 系统 内 存 布局 图 5-5 ”应 用 程序 内 存 分 区 


在 应 用 程序 启动 时 ， 一 般 会 为 堆 的 大 小 设置 一 个 上 限 。 而 堆 的 增长 由 内 存 分 配 例 程 加 以 
控制 ， 所 以 相关 例 程 便 不 断 地 检查 以 确保 请 求 分 配 不 会 超过 该 上 限 。 然 而 栈 由 硬件 来 自动 维 
护 。 伴 随 子 例 程 以 及 函数 的 调用 和 返回 ， 数 据 被 压 人 栈 里 和 从 栈 中 弹出 。 鉴 于 许多 应 用 程序 
会 调用 多 个 级 别 的 子 例 程 ， 有 时 还 是 递归 式 调 用 ， 所 以 这 种 栈 将 会 随 着 程序 的 运行 而 不 断 增 
长 。 但 是 , 没有 硬件 保护 机 制 能 够 防止 栈 的 扩展 超过 堆 的 上 限 。 为 此 ， 系 统 设立 了 一 个 栈 嗅 
探 器 ( stack sniffer) 子 系统 ， 在 监视 器 垂直 回 扫 (大 约 每 秒 60 次 ) 的 间隔 期 间 运 行 和 检查 栈 
增长 水 平 是 否 触 碰 到 了 堆 的 上 限 。 

如 何 最 佳 使 用 128KB 的 内 存 是 Mac 系统 设计 人 员 所 面临 的 一 个 大 问题 。 从 某 种 意义 上 
来 讲 ， 这 是 一 笔 大 量 的 内 存 。 同 一 时 代 的 其 他 个 人 计算 机 也 就 具有 16KB 或 64KB 的 内 存 。 
但 是 ，Mac 操作 系统 的 目标 是 要 拥有 图 形 化 用 户 界面 ， 而 此 类 界面 往往 会 耗 用 不 少 的 内 存 。 
正如 上 面 所 提 到 的 ， 开 发 人 员 决 定 限制 Mac 系统 一 次 只 运行 一 个 程序 。 于 是 ， 他 们 最 关心 
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的 似乎 是 内 存 碎片 化 一 一 不 断 的 内 存 分 配 和 回收 常常 会 导致 许多 小 的 被 隔离 的 内 存 区 域 ， 由 
于 它们 各 自 太 小 ， 所 以 即使 加 起 来 总 的 空闲 内 存 可 能 足以 满足 特定 请 求 也 不 能 得 到 利用 。 为 
了 避免 堆 内 存 的 碎片 化 ，Mac 操作 系统 支持 可 重 定位 的 内 存 块 。 这 些 内 存 块 通过 指向 不 可 重 
定位 的 主 指针 块 (master pointer block) 的 指针 来 间接 访问 。 上 一 章 讨论 的 Palm 操作 系统 也 
使 用 了 类 似 的 机 制 。 在 内 存 回收 过 程 中 ， 可 重 定位 块 经 常会 被 紧凑 处 理 。 可 重 定 位 块 也 可 以 
标记 为 可 清除 的 ， 从 而 意味 着 如 果 空 闲 内 存 空间 缩减 到 低 于 预定 的 限 值 ， 那 么 系统 就 可 以 在 
紧凑 期 间 把 它们 释放 掉 。 指 针 最 初 只 有 24 位 长 ， 但 是 考虑 到 处 理 器 在 可 预见 将 来 的 字 长 扩 
展 态势 ， 故 而 将 其 存放 在 了 32 位 字段 中 。 进 一 步 说 ，( 32 位 中 的 ) 高 8 位 通常 用 作 标志 位 以 
将 对 应 块 标记 为 可 重 定位 的 、 临 时 的 、 可 清除 的 ， 等 等 。 

操作 系统 采用 上 述 方案 实现 了 系统 堆 ( system heap) 以 及 应 用 程序 堆 (application heap) 
两 个 区 域 。 只 要 仅 有 一 个 程序 运行 ， 系 统一 般 能 够 工作 得 很 好 。 同 时 ， 鉴 于 应 用 程序 堆 在 程 
序 退 出 时 进行 了 清除 ， 所 以 碎片 化 问题 被 降低 到 了 最 小 程度 。 然 而 不 幸 的 是 ， 正 如 我 们 上 面 
一 再 提 到 的 ， 操 作 系 统 没 有 提供 任何 内 存 保护 措施 ， 所 以 由 应 用 程序 错误 操纵 系统 堆 而 导致 
的 骨 溃 情况 并 不 少见 


5.3.5 “只 读 存 储 器 


大 多 数 个 人 计算 机 仅 使 用 少量 的 只 读 存 储 器 来 存放 用 于 开机 上 自 检 ( Power-On Self-Test， 
POST) 的 代码 以 及 一 些 基 本 输入 /输出 系统 (Basic Input/Output System，BIOS) 例 程 ， 通 
常 也 就 8KB 左右 。 对 于 Mac 操作 系统 而 言 ， 相 应 的 只 读 存储 器 则 明显 要 大 些 (大 约 64KB )， 
并 且 保 持 有 操作 系统 自身 大 部 分 的 代码 。 在 只 读 存 储 器 中 存放 这 么 多 代码 的 最 初 目 的 是 避免 
占用 软盘 上 的 有 限 存 储 空 间 ， 因 为 早期 的 Mac 计算 机 并 没有 硬盘 。 同 时 ， 鉴 于 相关 代码 不 
必 再 从 软盘 驱动 器 读 取 ， 所 以 这 也 有 助 于 使 系统 启动 得 更 快 些 。 需 要 指出 的 是 ， 只 有 1991 
年 的 Mac 标 配 机 型 才 是 采用 单独 只 读 存 储 器 的 方式 进行 启动 的 。 另 外 ， 这 种 架构 还 有 助 于 
确保 只 有 苹果 计算 机 和 经 过 授权 的 克隆 才能 运行 Mac 操作 系统 。 


5.3.6” 增 量 版 本 


与 大 多 数 操作 系统 一 样 ，Mac 操作 系统 在 主要 版 本 之 间 也 有 增 量 版 本 ， 且 这 些 版 本 通常 
标 以 小 数 形式 。 进 一 步 说 ， 相 关 版 本 主要 是 出 于 如 下 各 种 原因 而 发 布 的 : 针对 诸如 操作 系统 
加 载 等 某 项 特定 功能 进行 提速 、 错 误 修复 以 及 为 稍 后 某 主要 版 本 安排 的 某 项 新 功能 或 应 用 程 
序 遭 遇 有 关 主 要 版 本 发 布 延 后 的 偶然 情况 。 在 Mac 操作 系统 的 第 1 版 系统 中 就 有 一 个 这 样 
的 版 本 ， 即 1.1 版 ， 相 关 发 布 缘由 涉及 了 上 述 各 个 方面 。 


5.4 Pcl 0 


论 上 讲 , 第 2 版 系统 是 一 个 主要 版 本 ,但 其 却 没 有 任何 从 理论 角度 来 看 具有 重大 意 
te rie 同时 还 剔除 了 某 些 图 标 / 命令 ， 并 新 增 了 用 
于 创建 新 文件 夹 和 关闭 系统 的 图 标 。 软 盘 现 在 的 弹出 操作 也 更 加 便捷 ， 仅 仅 需 要 将 它们 的 图 
标 拖 动 到 垃圾 箱 ( trash， 或 称 为 回收 站 ) 即 可 完成 ， 而 无 须 首先 选择 弹出 磁盘 命令 然后 再 将 
相应 图 标 拖 动 到 垃圾 箱 。 另 外 ， 还 添加 了 一 个 选择 打印 机 的 桌面 附件 ， 以 允许 用 户 选择 一 台 
默认 的 打印 机 。 该 实用 程序 后 来 演化 成 为 选择 器 ， 即 用 于 访问 共享 资源 (如 打印 机 、 调 制 解 
调 器 以 及 托管 在 其 他 系统 上 并 通过 网 络 提供 的 磁盘 卷 ) 的 实用 程序 。 
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5.4.1 图 形 化 用 户 界 面 


Mac 系统 的 用 户 喜 欢 图 形 化 用 户 界 面 以 及 从 一 个 应 用 程序 剪 切 信息 并 粘贴 到 另 一 个 应 
用 程序 的 能 力 。 不 过 ， 这 意味 着 先 得 从 一 个 程序 中 前 切 数据 ， 接 着 停止 该 程序 ， 然 后 再 启动 
新 程序 ， 并 将 相应 数据 粘贴 到 新 程序 当中 一 一 整个 操作 过 程 通常 需要 几 分 钟 。 每 款 新 的 Mac 
机 型 拥有 比 以 往 机 型 更 多 的 内 存 ，Mac 512K ( Macintosh 512K， 又 名 Fat Mac) 机 型 所 包含 
的 内 存 则 达到 先前 Mac 机 型 内 存 的 4 倍 。 这 足以 支持 某 种 形式 的 多 任务 ， 并 率先 在 切换 器 
程序 中 得 到 了 实现 。 进 一 步 说 ,切换 器 允许 用 户 启动 若干 程序 ， 然后， 用 户 便 可 以 通过 点 击 
菜单 栏 上 的 图 标 在 这 些 应 用 程序 之 间 进 行 切换 ， 于 是 ， 当 前 应 用 程序 将 会 沿 水 平方 向 滑 出 视 
图 ， 而 下 一 道 应 用 程序 紧 接着 滑 和 人 。 当 用 户 切 换 到 正在 运行 的 各 道 程序 中 的 某 一 道 程序 时 ， 
该 程序 被 称 为 持 有 焦点 (have the focus)。 在 这 种 情况 下 ， 用 户 可 以 在 几 秒 而 不 是 几 分 钟 实 
现在 应 用 程序 之 间 的 剪 切 和 粘贴 操作 。 


5.4.2 多 任务 


切换 器 在 内 存 中 创建 了 若干 可 把 应 用 程序 加 载 到 其 中 的 固定 插 柳 。 对 于 用 户 启动 的 每 道 
应 用 程序 而 言 ， 切 换 器 程序 将 会 为 之 分 配 一 个 单独 的 堆 ， 显 然 ， 用 户 启动 的 应 用 程序 数量 会 
受到 可 用 内 存 空间 的 制约 。 当 用 户 从 一 个 进程 切换 到 另 一 个 进程 时 ， 切 换 器 可 以 执行 上 下 文 
切换 并 准备 操作 系统 内 存 管理 数据 ， 以 便 使 操作 系统 开始 运行 新 的 应 用 程序 。 由 于 没有 内 存 
保护 或 指令 保护 ， 所 以 切换 器 可 以 调整 操作 系统 内 存 结构 来 实现 切换 。 尽 管 如 此 ， 这 是 非常 
受 限 的 多 任务 ， 有 点 像 Palm 操作 系统 ， 因 为 在 任何 时 间 仍 然 只 有 一 个 进程 运行 。 是 的 ， 用 
户 可 以 从 一 个 进程 切换 到 另 一 个 进程 ， 但 是 当 进 程 没有 持 有 焦点 时 ， 有 关 进 程 实际 上 并 没有 
运行 。 不 过 话 又 说 回来 ， 尽 管 这 种 方案 很 笨拙 ， 但 其 与 当时 系统 的 内 存 管理 方案 相处 得 还 行 ， 
即 程序 无 须 进行 改变 就 能 与 切换 器 协同 运行 。 同 时 ， 相 关 更 改 对 操作 系统 内 核 也 是 透明 的 。 
在 第 2 版 系统 中 具有 多 个 进程 的 典型 内 存 布局 如 图 5-6 所 示 。 


高 地 址 内 存 
5.5 第 3 版 系统 
5.5.1 多 级 文件 系统 应 用 






磁盘 驱动 器 存储 空间 变 得 越 来 越 大 ， 而 用 分 区 
户 当时 常常 倾向 于 把 磁盘 填 满 ， 就 像 用 户 现在 所 
做 的 一 样 ， 同 时 还 希望 能 够 快速 地 访问 他 们 的 所 
有 信息 。 需 要 强调 的 是 ， 这 意味 着 文件 数量 急剧 旧名 / 
地 增长 ， 因 而 让 用 户 变 得 难以 跟踪 相关 文件 。 在 分 区 
这 种 情况 下 ， 一 种 新 的 文件 系统 设计 方案 得 以 发 
布 ， 称 为 多 级 文件 系统 (Hierarchical File System ， 
HFS， 或 称 为 分 层 式 文件 系统 )。 它 替代 了 旧 的 和 
Mac 文件 系统 (Macintosh File System，MFS)。 其 
间 ， 文 件 夹 成 为 实 实在 在 的 子 目 录 ， 而 不 再 仅仅 是 | 
目录 项 中 的 标签 ， 并且 文件 夹 能 够 包含 其 他 的 文 。 分 区 
件 夹 。 这 种 文件 系统 更 加 令 人 满意 ， 并 开始 被 称 
为 Mac 操作 系统 标准 文件 系统 以 区 别 于 后 来 的 扩 ” 图 5-6 第 2 版 系统 “切换 器 ”内 存 布局 


76 锚 二 部 分 游 进 式 鸥 建 厅 作 系统 : 茄 向 广 民 的 螺 帮 式 方 法 


展 版 本 。 进 一 步 说 ， 有 关 目 录 项 还 包含 有 标明 文件 何 时 创建 和 何 时 最 后 一 次 修改 的 时 间 截 、 
文件 类 型 和 创建 程序 代码 、 最 多 32 字符 的 文件 名 以 及 其 他 的 文件 元 数据 。( 创 建 程序 代码 会 
告知 操作 系统 是 什么 应 用 程序 创建 了 相应 文件 。) 另外 ， 有 关系 统 采用 位 图 来 监测 空闲 空间 ， 
并 运用 B 树 来 存放 目录 。 相 关 思 想 将 在 第 12 章 和 第 13 章 展开 进一步 阐述 。 

期 间 ， 曾 发 布 过 几 个 错误 修复 版 本 (或 称 为 补丁 版 本 )， 直 到 有 关 操 作 系统 功能 又 一 次 
真正 提高 。 


5.5.2 网 络 


局 域 网 ( Local Area Network，LAN) 逐渐 流行 开 来 。 一 方面 ， 局 域 网 允许 共享 访问 
诸如 大 型 磁盘 驱动 器 、 高 端 激 光 打 印 机 、 调 制 解 调 器 池 等 价格 昂贵 的 设备 以 及 譬如 微缩 
胶片 输出 等 其 他 异乎 寻常 的 设备 。 另 一 方面 ， 局 域 网 还 通过 中 央 服 务 器 上 的 共享 文件 及 
目录 有 效 地 促进 和 方便 了 通信 。 因 此 , 在 3.3 版 系统 中 ， 苹 果 公 司 添加 了 对 苹果 共享 机 制 
(AppleShare) 一 一 一 种 专 有 的 文件 共享 协议 一 一 的 支持 。 有 关 协 议 栈 还 包括 其 他 层级 的 专利 
技术 ， 即 网 络 层 的 苹果 对 话 (AppleTalk) 协议 以 及 数据 链 路 层 和 物理 层 的 本 地 对 话 ( Local- 
Talk) 协议 。 现 在 的 选择 器 实用 例 程 也 比 当初 只 是 用 来 选择 默认 打印 机 而 变 得 更 为 重要 。 进 
一 步 说 ，LaserWriter ( 译 者 注 : 苹果 公司 激光 打印 机 品牌 名 ) 打印 机 可 以 直接 连接 到 网 络 上 
并 被 多 个 用 户 共享 。Mac 开始 被 视 为 一 个 强大 的 桌面 排版 系统 ， 而 相关 打印 机 则 是 这 种 看 法 
及 Mac 产品 线 全 面 成 功 的 一 个 重要 因素 。 


5.6 第 4 版 系统 

第 4 版 系统 首先 安装 在 了 Macintosh SE 和 Macintosh II 计算 机 上 。 在 当时 的 操作 系统 技 
术 开发 阶段 ， 新 的 操作 系统 版 本 通常 只 要 求 支持 新 型 计算 机 。 再 比方 说 ，4.1 版 系统 就 主要 
增加 了 对 大 于 32MB 的 磁盘 驱动 器 的 支持 。 

关于 Mac 操作 系统 是 何 时 支持 能 够 启动 多 个 应 用 程序 的 查找 器 版 本 的 问题 ， 不 同 的 参考 
文献 是 存在 分 歧 的 。 这 在 很 大 程度 上 可 能 是 因为 相关 版 本 的 命名 有 些 混 乱 。 有 具体 而 言 ， 在 当 
时 ， 主 软件 对 应 一 个 数 ， 查 找 器 对 应 另 一 个 数 ， 而 稍 后 马上 要 讨论 的 多 重 查找 器 ( Multi- 
Finder) 还 对 应 着 另外 一 个 数 。 例 如 ， 一 篇 参考 文献 9 列 出 了 System Software 5.0 ( System 4.2， 
Finder 6.0 和 MnultiFinder 1.0 )， 即 5.0 版 系统 软件 ( 4.2 版 系统 ，6.0 版 查找 器 和 1.0 版 多 重 
查找 器 )， 而 另 一 篇 参考 文献 9 则 指出 第 $ 版 系统 从 未 发 布 过 。 此 外 ， 由 于 多 重 查找 器 是 新 程 
序 ， 而 苹果 公司 尚 不 能 确定 当时 的 所 有 程序 可 和 否 在 其 下 面 正 确 运行 ， 所 以 原先 的 查找 器 继续 
与 有 关 操 作 系统 一 起 分 发 ， 从 而 加 剧 了 相关 版 本 命名 问题 的 严重 性 。 


5.6.1 多 重 查找 器 


尽管 如 此 ， 大 家 似乎 一 致 认为 4.2 版 系统 实现 了 多 重 查找 器 一 一 用 户 可 以 在 查找 器 〈 每 
次 只 支持 一 道 程序 ) 和 多 重 查找 器 (每 次 可 以 支持 多 道 程 序 ) 之 间 进 行 切 换 ， 如 图 5-7 所 示 。 
多 重 查找 器 显著 地 扩展 了 操作 系统 的 相关 功能 。 与 仅仅 将 操作 系统 从 运行 一 道 应 用 程序 切换 
到 运行 另 一 道 应 用 程序 的 切换 器 不 同 ， 多 重 查找 器 允许 每 道 程序 保持 运行 ， 并 为 每 道 应 用 程 
序 提供 处 理 器 时 间 。 与 我 们 稍 后 将 要 学 习 的 操作 系统 也 不 相同 ，Mac 操作 系统 没有 对 一 个 进 
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程 能 够 继续 运行 多 长 时 间 而 不 切换 到 另 一 个 进程 设置 硬性 限制 。 在 Mac 操作 系统 中 所 采用 
的 技术 称 为 协作 式 多 任务 ( cooperative multitasking)。 利 用 这 种 技术 ， 一 个 进程 可 以 想 运 行 
多 长 时 间 就 运行 多 长 时 间 。 如 果 有 关 进 程 调用 了 操作 系统 ， 而 操作 系统 不 能 立即 提供 相应 服 
务 ， 壁 如 磁盘 读 取 ， 那 么 操作 系统 将 会 让 有 关 进 程 等 待 一 一 一 种 称 为 阻塞 ( blocking) 的 机 
制 。 当 进程 执行 了 此 类 阻塞 性 调用 时 ， 操 作 系统 将 会 把 被 阻塞 的 进程 添加 到 正在 等 待 某 项 事 
件 的 进程 队列 中 ， 然 后 进行 切换 和 运行 另 一 个 进程 。 而 如 果 一 个 进程 没有 执行 任何 阻塞 性 调 
用 ， 那 么 对 应 进程 可 以 想 运行 多 长 时 间 就 运行 多 长 时 间 。 为 了 让 所 有 进程 都 能 够 对 用 户 的 请 
求 做 出 快速 的 响应 ， 所 有 进程 都 需要 一 些 处 理 器 时 间 。 换 句 话 说， 如 果 一 个 进程 运行 时 间 太 
长 ， 就 有 可 能 使 系统 性 能 失去 均衡 和 不 再 稳定 。 为 了 防止 这 种 情况 的 发 生 ， 所 有 进程 都 应 该 
经 常 执行 一 条 特殊 的 系统 调用 ， 以 告知 操作 系统 尽管 相应 进程 本 身 尚 未 结束 ， 但 是 将 主动 放 
弃 控 制 并 准备 好 了 再 次 运行 。 这 便 允 许 其 他 的 进程 拥有 公平 合理 的 处 理 器 时 间 份 额 。 当 然 ， 
一 些 供应 商 往往 希望 自己 的 软件 看 起 来 是 响应 最 好 的 ， 故 而 并 不 经 常 调用 有 关机 制 。 另 外 在 
某 些 情况 下 ， 软 件 错误 可 能 会 导致 程序 陷入 循环 ， 故 而 使 有 关 程 序 永 不 放弃 控制 或 从 不 执行 
阻塞 性 调用 。 一 旦 这 些 情 况 发 生 ， 有 关系 统 将 基本 上 停滞 不 前 。 


start up "System Tools 1" with: 
局 


国富 Finder 中 舍命 侈 MultiFinder 


Upon startup, automatically open: 


OO Seler te Pes 
OV Ed 疙 泪 泪 竺 5 我 让 你 全 人 全 振 舍 等 引 $ 
Finder Only 


图 5-7 多 重 查找 器 


5.6.2 多重 查找 器 与 图 形 化 用 户 界面 


多 重 查找 器 为 来 自 不 同 应 用 程序 的 诸多 窗口 提供 了 一 种 使 用 分 层 模 型 同时 共存 的 方法 。 
既然 可 能 有 多 个 运行 的 应 用 程序 ， 而 它们 可 能 每 道 程序 都 有 多 个 在 桌面 上 同时 打开 的 窗口 ， 
那么 ， 当 一 道 程 序 得 到 焦点 时 ， 它 的 所 有 窗口 将 会 被 往 前 提 到 一 起 进而 分 布 在 同一 个 层 上 。 
这 是 为 了 与 已 有 视窗 机 制 的 应 用 程序 接口 保持 兼容 而 必需 的 。 


5.6.3 ”内 存 管理 与 多 重 查找 器 


多 重 查找 器 还 为 应 用 程序 提供 了 一 种 向 操作 系统 传达 其 内 存 要 求 的 方法 ， 以 便 多 重 查找 
器 可 以 根据 每 道 程序 的 需要 为 其 分 配 内 存 。 可 惜 的 是 ， 被 指定 的 数量 对 于 某 些 任务 来 说 并 不 
够 用 ， 于 是 便 向 用 户 提供 了 一 个 否决 和 重 置 有 关 数 量 的 界面 。 这 大 大 地 违背 了 苹果 公司 关于 
用 户 应 当 远 离 此 类 技术 信息 的 相关 理论 。 就 此 案例 而 言 ， 他 们 的 理论 无 疑 是 正确 的 ， 因 为 用 
户 在 一 般 情况 下 并 不 清楚 一 道 程序 实际 可 能 需要 多 少 内 存 。 为 此 ， 经 常 是 分 配给 这 道 程序 比 
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其 实际 需求 还 要 多 的 内 存 ， 而 分 配给 另 一 道 程序 的 内 存量 则 又 太 少 。 相 应 结果 是 ,“ 饥 饿 的 ” 
应 用 程序 运行 表现 非常 不 好 。 客 观 而 言 ， 在 多 道 应 用 程序 同时 运行 的 情况 下 ， 内 存 管理 通 
常 比 单 道 应 用 程序 运行 的 情况 要 复杂 得 多 。 但 是 在 开发 多 重 查找 器 的 时 候 ， 一 个 关键 的 考虑 
因素 是 在 单个 的 查找 器 下 正常 运行 的 程序 应 该 不 经 改变 就 可 以 在 多 重 查 找 器 下 正常 运行 。 因 
此 ,三 者 的 内 存 架 构 非常 相似 ， 只 是 后 者 要 稍微 复杂 一 点 而 已 。 关 于 运行 一 道 应 用 程序 的 内 
存 体系 结构 如 图 5-4 所 示 。 而 当 多 道 应 用 程序 同时 运行 时 ， 相 应 的 内 存 体系 结构 如 图 5-6 所 
示 。 当 执行 从 一 道 应 用 程序 切换 到 男 一 道 应 用 程序 时 ， 操 作 系 统 将 会 改变 某 些 系统 变量 的 内 
容 以 反映 新 应 用 程序 的 应 用 程序 分 区 及 各 组 成 部 分 的 大 小 和 位 置 。 这 种 更 改称 为 上 下 文 切换 
(context switch)。 正 如 我 们 后 面 将 会 看 到 的 那样 ， 现 代 操 作 系 统 的 上 下 文 切换 通常 比 这 要 更 
为 复杂 。 


5.7 第 5 版 系统 


如 上 所 述 ， 一些 参考 文献 宣称 ,第 5 版 系统 从 未 发 布 过 ， 而 其 他 的 一 些 文献 则 认为 其 发 
布 仅 限于 很 短 的 一 段 时 间 。 无 论 哪 一 种 情况 ， 从 研究 和 学 习 操 作 系统 演化 的 角度 而 言 ， 都 没 
有 什么 值得 关注 的 内 容 。 


5.8 第 6 版 系统 


在 许多 观察 者 的 眼中 ， 第 6 版 系统 ( System 6 ) 是 Mac 操作 系统 的 第 一 次 真正 升级 9。 随 机 
存 取 存 储 器 越 来 越 便宜 ， 容 量 越 来 越 大 ， 而 用 户 也 总 是 想 要 更 多 的 空间 。 因 此 ， 第 6 版 系统 
开始 迁移 和 支持 Mac 计算 机 运行 在 伴随 Motorola 68020 处 理 器 而 出 现 的 真正 的 32 位 内 存 寻 
址 模式 下 。32 位 地 址 允许 Mac 操作 系统 最 多 寻 址 4GB 的 随机 存 取 存储 器 。 然 而 ， 在 早期 版 
本 的 Mac 操作 系统 中 ， 只 把 较 低 的 24 位 用 于 寻 址 ， 而 把 高 8 位 作为 标志 位 和 用 来 说 明 所 指 
向 的 块 是 被 标记 为 “锁定 ”“ 可 清除 ”还 是 作为 “资源 ”等 。 这 对 于 随机 存 取 存储 器 十 分 有 
限 的 早期 硬件 而 言 曾经 是 有 效 的 解决 方案 ,但 后 来 却 成 为 一 种 负担 。 苹 果 公 司 把 采用 24+8 
位 寻 址 模型 的 代码 称 为 非 彻底 32 位 的 (或 称 为 非 纯 粹 32 位 的 )， 同 时 建议 相关 开发 人 员 从 
他 们 的 应 用 程序 中 移 除 此 类 代码 。 如 前 所 述 ,Mac 操作 系统 的 大 部 分 代码 都 在 只 读 存储 器 中 。 
令 人 遗憾 的 是 ， 那 部 分 只 读 存储 器 代码 大 多 数 是 非 彻 底 32 位 的 ， 故 而 老 旧 的 Mac 计算 机 不 
能 迁移 到 这 种 新 模式 下 。 这 种 新 模式 需要 新 版 本 的 硬件 。 与 此 同时 ， 改 变 为 32 位 寻 址 模式 
还 产生 了 许多 兼容 性 问题 ， 甚 至 还 继续 存留 在 今天 的 Mac 操作 系统 版 本 中 。 进 一 步 说 ， 操 
作 系 统 继续 保持 着 以 24 位 模式 运行 应 用 程序 的 能 力 ， 虽 然 该 模式 要 比 32 位 模式 慢 很 多 。 也 
正 因 如 此 ， 苹 果 公司 这 时 候 已 开始 感觉 到 支持 传统 应 用 程序 的 重 压 。 

在 个 人 计算 机 时 代 的 早期 ， 开 发 人 员 仍 然 将 系统 中 的 随机 存 取 存 储 器 看 作 非 常 紧张 的 资 
源 ， 并 且 会 竭尽 全 力 地 去 节省 一 两 个 字 节 。 但 随 着 时 间 的 推移 ， 经 常 发 现 这 样 的 节省 后 来 往 
往 会 造成 一 些 非常 负面 的 影响 。 事 实 上 ,， 千年 虫 (Y2K bug 或 Year 2000 ) 9 就 是 由 于 希望 节 
省 几 个 字 节 的 随机 存 取 存储 器 而 通过 将 日 期 的 年 份 部 分 的 格式 缩短 成 最 后 两 个 字 节 所 引起 的 
此 类 问题 的 另 一 个 例子 。 当 时 ， 尽 管 距 离世 纪 末 还 有 20 年 左右 的 时 间 ， 但 开发 人 员 普 遍 认 
为 他 们 开发 的 系统 到 那 时 候 将 不 再 正常 运行 。 进 一 步 说 ， 当 世纪 末 最 后 一 年 即将 结束 的 时 
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候 ， 日 期 年 份 存储 为 两 位 数 的 系统 将 会 得 出 不 正确 的 结论 ， 即 认定 “00”( 即 2000 ) 年 的 日 
期 反而 在 “99”( 即 1999 ) 年 的 日 期 之 前 。 显 然 ，Mac 操作 系统 从 一 开始 的 设计 就 避免 了 千 
年 虫 问题 ， 尽 管 苹果 公司 从 未 正式 证 实 第 7 版 系统 ( System 7 ) 之 前 的 任何 系统 版 本 是 正确 
满足 2000 年 年 份 存储 要 求 的 。 


5.9 第 7 版 系统 


第 7 版 系统 是 到 那个 时 候 为 止 针 对 有 关系 统 软 件 所 做 的 最 大 改变 。 它 继续 实现 Mac 操 
作 系 统 到 彻底 的 32 位 寻 址 方式 的 迁移 ， 改 进 了 对 彩色 图 形 、 网 络 和 多 任务 (multitasking) 
的 处 理 ， 并 引入 了 某 种 形式 的 虚拟 内 存 (virtual memory， 或 称 为 虚拟 存储 髓 )。 

与 此 同时 ， 在 早期 版 本 的 Mac 操作 系统 中 提供 作为 选项 的 许多 功能 被 集成 到 了 第 7 版 
系统 中 。 该 版 系统 还 抛弃 了 查找 器 的 单一 程序 版 本 ， 从 而 消除 了 查找 器 与 多 重 查找 器 对 决 的 
问题 。 于 是 ， 协 作 式 多 任务 成 为 系统 的 正常 运作 模式 。 基 于 AppleTalk 的 网 络 支持 以 及 基于 
AppleShare 的 文件 共享 也 不 再 是 作为 选项 ， 而 是 被 符 入 了 操作 系统 内 部 。 


5.9.1 图 形 化 用 户 界面 


第 7 版 系统 在 若干 方面 改进 了 可 用 性 ， 其 中 许多 是 关于 图 形 化 用 户 界面 的 。 具 体 而 言 ， 
在 菜单 栏 的 右 端 新 添加 了 一 个 菜单 ， 称 为 应 用 程序 菜单 。 应 用 程序 菜单 给 出 了 一 个 正在 运行 
的 程序 的 列表 ， 并 允许 用 户 在 它们 之 间 进 行 切换 。 在 应 用 程序 菜单 的 旁边 是 帮助 菜单 。 同 
时 ， 用 户 现在 可 以 执行 更 为 简单 的 拖 放 操作 一 一 一 个 文本 块 可 以 用 鼠标 从 一 个 程序 拖 到 另 一 
个 程序 ， 而 不 必 非 得 像 以 往 那 样 先 复制 再 粘贴 。 第 7 版 系统 的 查找 器 最 终 利用 了 颜色 特性 ， 
从 而 使 某 些 界面 元 素 看 起 来 更 加 立体 化 。 除 此 之 外 ,第 7 版 系统 还 添加 了 其 他 的 一 些 可 用 
性 功能 。 进 一 步 说 ，WorldScript 为 除了 英语 之 外 的 语言 提供 了 系统 级 的 支持 ， 而 同步 发 
布 的 各 种 技术 则 具体 包括 用 于 任务 自动 化 的 宏 语 言 AppleScript ( 即 苹果 脚本 语言 )、 颜 色 
管理 实用 程序 ColorSync、 多 媒体 软件 QuickTime 以 及 字体 管理 程序 TrueType ( 即 字 型 标 
准 )。 随 着 时 间 的 推移 ， 我 们 与 现代 的 图 形 化 用 户 界 面 进行 交互 的 许多 功能 特征 都 被 陆 陆 
续 续 地 添加 到 了 Mac 操作 系统 中 。 在 大 多 数 情况 下 ， 我 们 不 会 在 每 个 版 本 中 详细 盖 述 相关 
功能 。 我 们 通常 只 会 提示 图 形 化 用 户 界面 正在 不 断 演化 发 展 ， 并 且 随 时 间 的 推移 而 变 得 更 
好 用 。 


5.9.2 虚拟 内 存 


有 时 用 户 希 望 同 时 运行 比 内 存 可 容纳 的 程序 数量 还 要 多 的 程序 。 或 者 有 关 程 序 可 能 用 
到 了 一 个 非常 大 的 数据 文件 。 例如， 对 于 一 个 字 处 理 程序 来 说 ， 如 果 其 只 是 被 用 来 编写 办 公 
室 的 备忘录 ， 那 么 通常 很 小 的 空间 便 可 以 存放 得 下 ; 但 如 果 其 用 来 编辑 一 份 大 型 的 报告 ， 那 
么 它 就 可 能 需要 大 量 的 内 存 。 进 一 步 说 ， 如 果 需 要 较 多 内 存 但 却 由 于 内 存 过 于 昂贵 等 原因 而 
没有 较 大 内 存 可 用 的 情况 下 ， 系 统 性 能 往往 会 变 得 很 差 ， 于 是 这 时 候 可 以 采用 一 种 称 为 虚拟 
内 存 ( Virtual Memory，VM) 的 解决 方案 。 虚 拟 内 存 是 使 用 硬盘 驱动 器 上 的 一 些 空间 来 模拟 
较 大 的 主 存 的 一 种 技术 。 它 需要 额外 的 内 存 管理 硬件 支持 才能 工作 。 人 简要 来 说 ， 内 存 被 划分 
成 所 谓 页 面 (page) 的 物理 块 。 当 程序 开始 运行 的 时 候 ， 只 有 该 程序 的 第 一 个 页 面 被 送 入 内 
存 。 而 当 正 在 运行 的 程序 引用 尚未 进入 内 存 的 程序 部 分 时 ， 相 关 硬 件 将 会 触发 所 谓 缺 页 故障 
( page fault) 的 中 断 ， 然 后 操作 系统 就 会 从 磁盘 驱动 器 把 所 缺 的 页 面 读 到 内 存 中 。 这 种 技术 
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将 会 在 第 11 章 展开 更 为 详细 的 讨论 。 

刚才 提 到 过 ， 在 计算 机 系统 中 需要 特殊 的 硬件 才 可 以 使 操作 系统 能 够 支持 虚拟 内 存 。 具 
体 而 言 ， 计 算 机 必须 具有 特殊 的 内 存 管理 单元 ( Memory Management Unit，MMU)， 其 能 够 
解释 在 处 理 器 中 运行 的 程序 所 生成 的 逻辑 地 址 ( logical address)， 并 把 它们 转换 为 物理 地 址 
(physical address)， 故 而 程序 的 各 个 页 面 可 以 被 安置 在 随机 存 取 存储 器 的 任何 地 方 。 苹 果 公 
司 的 基于 68040 处 理 器 和 68030 处 理 器 的 机 器 在 处 理 器 中 内 置 了 支持 虚拟 内 存 的 内 存 管理 单 
元 ， 因 此 在 没有 额外 硬件 的 情况 下 就 能 够 支持 虚拟 内 存 。Mac II 型 计算 机 (基于 68020 处 理 
器 ) 可 能 在 其 主 迎 辑 板 (main logic board， 简 称 主板 ) 上 具有 一 个 特殊 的 内 存 管 理 单元 协 处 
理 器 ， 顶 蔡 了 标准 的 地 址 管理 单元 ( Address Management Unit，AMU) 9， 该 内 存 管 理 单元 
也 支持 虚拟 内 存 。 

对 于 Mac 操作 系统 来 说 ， 虚 拟 内 存 是 首先 在 第 7 版 系统 中 实现 的 。 然 而 ， 其 虚拟 内 存 
支持 非常 初级 ， 且 在 许多 情况 下 执行 得 很 差 。 进 一 步 说 ， 按 照 有 关 操 作 系 统 的 内 存 管理 器 的 
设计 方案 ,在 虚拟 内 存 机 制 下 使 用 内 存 时 ， 常 常会 导致 发 生 过 多 的 页 面 故障 98。 同 时， 在 现 
代 的 其 他 操作 系统 的 虚拟 内 存 实现 中 通常 可 以 找到 的 虚拟 内 存 功 能 一 一 例如 受 保护 的 地 址 空 
间 、 内 存 映 射 文件 、 页 面 锁 定 、 共 享 内 存 ， 等 等 一 一 在 第 7 版 系统 中 尚未 出 现 。 换 句 话 说 ， 
其 中 许多 功能 是 在 Mac 操作 系统 的 更 高 版 本 中 才 提 供 的 。 伴 随 苹 果 公 司 对 虚拟 内 存 工 作 原 
理 的 理解 的 加 深 及 其 对 有 关 操 作 系 统 特定 部 分 行为 的 修正 ， 在 运行 虚拟 内 存 时 的 系统 性 能 也 
得 到 了 持续 的 改善 。 


5.9.3 ”新 型 处 理 器 

大 致 在 1990 年 ， 蕴 果 公 司 与 IBM 公司 和 摩托 罗拉 公司 结 成 联盟 ， 一 起 开发 一 种 在 结 
合 了 IBM RS6000 架构 、Motorola 68000 和 英特尔 个 人 计算 机 生产 线 的 基础 之 上 的 新 款 处 
理 器 系列 ， 其 被 称 为 PowerPC (强力 个 人 计算 机 ) 系列 ， 并 长 期 决定 着 苹果 公司 的 硬件 发 展 
方向 ， 直 到 2006 年 。 最 初 采用 PowerPC 处 理 器 的 Mac 计算 机 是 Power Macintosh 6100 或 
Performa 6100 系列 。 而 对 这 款 处 理 器 系列 的 支持 则 始 于 7.1.2 版 系统 ( System 7.1.2 )。 为 支 
持 有 关 处 理 器 ，Mac 操作 系统 的 设计 方案 不 得 不 进行 必要 的 更 改 。 有 具体 而 言 ， 有 关 处 理 器 
架构 是 精简 指令 集 计 算 机 ( Reduced Instruction Set Computer，RISC) 设计 方案 ， 与 摩托 罗 
拉 68000 系列 所 采用 的 复杂 指令 集 计 算 机 ( Complex Instruction Set Computer，CISC) 设计 
方案 不 同 ， 故 而 说 明 处 理 器 所 使 用 的 代码 已 经 发 生 了 根本 性 的 改变 。 考 虑 到 要 把 基于 68000 
架构 的 操作 系统 完全 移植 到 精简 指令 集 计 算 机 架构 上 将 会 耗费 特别 长 的 时 间 ， 所 以 PowerPC 
架构 的 设计 方案 允许 其 自身 对 68000 处 理 器 进行 仿真 处 理 。 

一 小 段 被 称 为 超 微 内 核 (nanokernel) 的 代码 用 来 管理 PowerPC 处 理 器 。 其 运行 在 管理 
程序 模式 下 ， 并 为 系统 的 其 余部 分 提供 有 关 硬 件 管理 的 低级 接口 。 该 超 微 内 核 的 应 用 程序 接 
口 仅 限于 系统 软件 和 调试 程序 (或 称 为 调试 器 ) 进行 使 用 。 在 系统 启动 时 ， 由 超 微 内 核 启动 
68000 仿真 器 ， 后 者 仅仅 仿真 68000 用 户 模 式 指 令 集 ， 而 并 没有 对 相关 内 存 管理 单元 进行 仿 
真 ， 这 样 做 有 利于 支持 更 普遍 的 兼容 性 。 于 是 ， 有 关 操 作 系 统 几乎 立即 就 能 在 基于 PowerPC 
的 系统 上 开始 运行 。 当 然 ， 在 PowerPC 上 仿真 68000 处 理 器 的 执行 要 远 远 慢 于 对 PowerPC 
原生 代码 的 执行 。 此 外 ， 相 关 程 序 可 以 被 编译 和 链接 生成 既 包 含 68000 原生 代码 又 包含 
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PowerPC 原生 代码 的 可 执行 模块 。 这 便 允 许 相 应 的 单一 版 本 的 程序 既 可 以 在 老 旧 机 器 上 运 
行 ， 又 可 以 在 新 型 机 器 上 运行 。 这 样 的 双 模 式 程序 被 称 为 胖 二 进 制 代 码 ( fat binary)。 在 这 
两 种 模式 之 间 的 切换 是 通过 一 组 称 为 代码 片段 管理 器 (Code Fragment Manager，CFM) 的 库 
例 程 来 完成 的 。 久 而 和 久之， 有关 操作 系统 越 来 越 多 的 代码 被 修改 成 为 既 包 含 PowerPC 原生 
代码 ， 又 包含 仍然 可 以 在 68000 系列 系统 上 运行 的 代码 。 

苹果 计算 机 的 体系 结构 一 直 是 专 有 的 ， 因 而 会 产生 几 方 面 的 效应 ， 有 些 是 正面 的 , 但 
也 有 一 些 是 负面 的 。 在 Mac 计算 机 中 主要 的 苹果 系统 总 线 称 为 NuBus ( 读 作 “ New Bus”， 
即 新 型 总 线 )。 由 于 它 是 专 有 性 质 的 ， 所 以 全 果 公 司 可 以 对 所 有 的 硬件 开发 实施 严格 的 控 
制 。 因 此 ， 相 关 控 制 器 更 可 能 在 Mac 计算 机 上 而 不 是 企业 标准 架构 (Industry Standard 
Architecture，ISA) 总 线 的 机 器 上 正常 工作 ， 同 时 相应 的 驱动 程序 也 更 可 能 在 Mac 计算 机 上 
正常 运行 。 另 一 方面 ， 这 也 意味 着 在 这 个 市 场 上 遇 到 的 竞争 较 少 ， 故 而 用 户 为 有 关 硬 件 和 软 
件 支付 的 价格 要 高 于 他 们 可 能 为 其 他 品牌 计算 机 支付 的 价格 。 此 外 ， 只 有 极 少 的 供应 商 能 够 
承受 得 起 去 雇用 额外 的 员工 来 开发 针对 其 他 总 线 的 硬件 。 在 1990 年 前 后 ,英特尔 开始 着 手 
开发 一 种 称 为 外 围 部 件 互 连 (Peripheral Component Interconnect，PCI) 总 线 的 标准 化 总 线 。 
到 1993 年 ， 相 应 完整 的 规范 说 明 得 以 推出 ， 插 件 厂 商 开 始 为 这 种 新 的 总 线 构建 输入 /输出 
插件 ， 系 统制 造 商 也 开始 将 它们 包含 在 新 的 主板 设计 当中 。 在 这 种 情况 下 ， 苹 果 公司 发 现 有 
关 总 线 专 有 战略 让 他 们 在 竞争 中 处 于 了 劣势 。 具 体 来 说 ， 鉴 于 供应 商 可 以 在 外 围 部 件 互 连 总 
线 市 场 上 销售 的 数量 要 明显 大 于 在 苹果 新 型 总 线 市 场 上 的 销售 数量 ， 所 以 苹果 必须 得 为 接口 
控制 器 支付 更 高 的 价格 ,而 这 既 减 少 了 他 们 的 硬件 利润 ， 又 使 得 他 们 的 系统 价格 降低 了 竞争 
力 。 为 此 ,苹果 计算 机 公司 在 1995 年 推出 的 强力 Mac 计算 机 中 集成 了 外 围 部 件 互 连 总 线 。 
进一步 说 ，7.5.2 版 系统 对 这 些 新 机 器 给 予 了 支持 ， 故 而 需 为 外 围 部 件 互 连 总 线 和 控制 器 增 
加 新 的 驱动 程序 和 芯片 集 支 持 。 


5.9.4 输入 /输出 增强 


Mac 系统 存在 于 一 个 由 基于 英特尔 且 运 行 着 微软 软件 的 个 人 计算 机 所 主导 的 世界 上 。 因 
此 ，Mac 系统 面临 相当 大 的 压力 去 建立 和 提供 通 向 相关 计算 机 系统 的 “桥梁 ” 。 毋 庸 置疑 ， 
网 络 支 持 就 是 沿 着 相应 方向 不 断 演化 和 向 前 发 展 的 ， 于 是 许多 面向 微软 的 协议 被 添加 到 了 
Mac 操作 系统 的 支持 当中 。 另 一 个 例子 则 是 ，7.1 版 系统 引入 了 能 够 访问 MS-DOS 格式 软盘 
的 称 为 PC Exchange (个 人 计算 机 交换 ) 的 软件 。 早 期 版 本 的 Mac 操作 系统 只 支持 苹果 版 软 
盘 格式 。 虽 然 IBM PC 和 苹果 公司 Mac 计算 机 的 软盘 在 物理 上 是 相同 的 ， 但 它们 却 以 两 种 
不 同 的 方式 进行 使 用 。 首 先 ， 二 者 的 低级 格式 化 (low-level formatting) 不 同 。 新 软盘 在 大 
多 数 情况 下 并 没有 任何 预先 指定 的 扇 区 数 或 扇 区 大 小 。 而 一 个 被 称 为 低级 格式 化 的 进程 用 来 
在 磁道 上 写 下 扇 区 头 部 信息 ， 从 而 供 以 后 告知 相关 硬件 每 个 扇 区 的 开始 位 置 以 及 对 应 扇 区 的 
磁道 号 、 记 区 号 和 大 小 。 不 同 的 系统 可 能 使 用 不 同 数量 和 尺寸 的 扇 区 ， 并 且 早 期 关于 介质 的 
各 种 尺寸 及 低级 格式 存在 着 许多 相互 竞争 的 格式 规定 。 现 在 ， 相 关 尺 寸 和 格式 已 经 相当 标准 
化 了 , 但 在 20 世纪 90 年代 初 ， 则 依然 存在 着 若干 相互 竞争 的 标准 。 一 旦 完成 了 低级 格式 
化 ， 有 关 用 户 就 可 以 使 用 操作 系统 在 更 高 级 别 上 对 软盘 进行 “格式 化 " ， 即 在 磁盘 上 创建 一 
个 空 的 文件 系统 。 对 于 IBM 公司 和 苹果 公司 的 系统 来 说 ， 二 者 的 文件 系统 也 是 不 同 的 ， 这 
一 点 就 像 二 者 的 低级 格式 化 一 样 。 鉴 于 用 户 之 间 方 便 轻松 的 文件 交换 非常 必要 ， 所 以 在 Mac 
操作 系统 中 添加 了 读 写 MS-DOS 软盘 的 能 力 ， 从 而 使 Mac 系统 在 办 公 室 领域 更 容易 受到 认 
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可 和 被 接纳 。 

到 了 这 个 时 候 ， 笔 记 本 电脑 系统 已 经 被 频繁 使 用 ， 而 且 它们 往往 会 包含 一 个 个 人 计算 

机 卡 (PC card， 或 称 为 PC 卡 ) 的 插 槽 。 这 些 插 槽 当时 被 称 为 PCMCIA ( Personal Computer 

104| Memory Card International Association， 个 人 计算 机 存储 卡 国际 协会 ) 插 槽 ， 但 后 来 被 改名 。 
个 人 计算 机 卡 插 槽 允许 插入 一 部 未 内 置 在 原先 的 笔记 本 电脑 中 的 设备 。 典 型 的 例子 包括 网 
卡 、 外 部 磁盘 驱动 控制 器 、 磁 盘 驱动 器 本 身 以 及 内 存 卡 (RAM 卡 ， 或 称 为 随机 存 取 存 储 器 
卡 )。 内 存 卡 无 法 作为 主 存 而 被 寻 址 ， 因 为 PCMCIA 插 槽 位 于 输入 /输出 总 线 上 。 因 此 ， 一 
种 处 理 这 种 卡 的 常见 技术 是 将 其 视 为 一 种 特殊 类 型 的 磁盘 驱动 器 并 在 其 上 面 创 建文 件 系统 。 
考虑 到 软盘 格式 大 小 基本 合适 ， 所 以 这 些 内 存 卡通 常 采用 MS-DOS 兼容 文件 系统 来 进行 创 
建 ， 这 样 它 们 随后 也 可 以 用 于 把 数据 从 IBM 兼容 的 个 人 计算 机 上 迁移 到 Mac 计算 机 上 ， 因 
为 Mac 操作 系统 也 可 以 读 取 这 些 设备 。 

由 于 对 有 关 操 作 系 统 常规 功能 的 增强 以 及 面向 与 强力 个 人 计算 机 处 理 器 协同 使 用 的 胖 二 
进 制 代 码 ， 第 7 版 系统 成 为 Mac 操作 系统 的 第 一 个 完整 安装 太 大 而 无 法 在 1.44MB 软盘 上 
容纳 下 的 版 本 。 其 结果 是 ，7.5 版 系统 及 更 高 版 本 不 再 从 软盘 驱动 器 运行 ， 而 是 要 求 相应 计 
算 机 上 拥有 一 个 硬盘 。 


5.10 第 8 版 系统 


这 时 候 ， 苹 果 公 司 正在 把 Mac 系统 添加 到 他 们 的 旨 在 用 作 服 务 器 的 产品 系列 中 。 在 某 
些 情 况 下 ， 这 些 新 系统 拥有 多 个 处 理 器 。 因 此 ， 第 8 版 系统 增加 了 对 这 些 新 的 Mac 多 处 理 
器 模型 的 支持 。 这 些 机 器 将 会 在 承担 服务 器 角色 的 过 程 中 获得 更 好 的 性 能 。 在 现代 操作 系统 
中 对 此 类 系统 的 支持 被 称 为 对 称 多 处 理 (Symmetric MultiProcessing，SMP )。 在 这 种 情况 下 ， 
操作 系统 可 以 运行 在 任何 可 用 的 处 理 器 上 S。 这 可 能 会 给 操作 系统 带 来 一 些 特殊 的 问题 ， 因 
为 有 关 操 作 系 统 可 以 真正 地 同时 在 两 个 或 多 个 处 理 器 上 运行 。 换 句 话 说， 这 意味 着 有 关 操 作 
系统 必须 得 采取 特殊 的 预防 措施 ， 以 防止 有 两 个 正在 运行 的 实例 同时 操作 任何 一 个 数据 元 
素 。 鉴 于 Mac 操作 系统 本 来 是 一 个 单 用 户 系统 ， 所 以 我 们 把 关于 对 称 多 处 理 的 更 深入 的 讨 
论 推迟 到 关于 Linux 的 下 一 章 ， 而 该 操作 系统 是 从 一 开始 就 设计 为 支持 多 个 用 户 并 运行 许多 
其 他 服务 的 。 

另外 ,在 第 8 版 系统 中 还 引入 了 个 人 网 页 共享 ， 这 一 机 制 允 许 用 户 在 自己 的 计算 机 上 组 
织 存储 和 发 布 网 页 。 


5.10.1 多 级 文件 系统 升级 版 


伴随 时 间 的 行进 步伐 ， 硬 盘 驱动 器 的 存储 容量 也 变 得 越 来 越 大 。 然 而 不 幸 的 是 ， 早 先 为 

了 节省 磁盘 和 随机 存 取 存 储 器 中 的 宝贵 的 空间 ， 所 以 针对 较 小 存储 容量 的 驱动 器 而 设计 的 文 

件 系统 所 使 用 的 是 较 小 的 指针 。 这 些 指 针 不 能 寻 址 较 大 存储 容量 的 驱动 器 上 的 所 有 扇 区 ， 故 

而 发 明了 各 种 机 制 来 对 早期 的 文件 系统 进行 扩展 以 使 其 适应 更 大 存储 容量 的 驱动 器 。 其 中 ， 

第 一 种 技术 是 按 由 多 个 扇 区 组 成 的 盘 块 而 不 是 单个 扇 区 来 进行 分 配 。 例 如 ， 在 第 3 版 系统 中 

引入 的 多 级 文件 系统 在 其 数据 结构 中 采用 了 16 位 指针 ， 故 而 意味 着 只 有 65 536 个 扇 区 可 以 


9 ”在 非 对 称 多 处 理 系 统 中 ， 操 作 系 统 只 会 运行 在 某 一 个 处 理 器 上 ， 而 应 用 程序 则 可 以 运行 在 任何 一 个 处 理 
器 上 。 尽 管 非 对 称 多 处 理 比 对 称 多 处 理 更 为 简单 ， 但 由 于 其 限制 了 总 的 系统 性 能 ， 所 以 现在 这 项 技术 已 
很 少 使 用 。 
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直接 寻 址 处 理 。 按 照 512 字 节 的 标准 肩 区 大 小 ， 这 便 意 味 着 相应 文件 系统 不 能 支持 存储 容量 
大 于 32MB 的 驱动 器 。 因 此 多 级 文件 系统 允许 基于 由 多 个 扁 区 组 成 的 盘 块 而 不 是 单个 扇 区 来 
进行 分 配 。 进 一 步 说 ， 如 果 分 配 是 在 两 个 扇 区 构成 的 盘 块 的 基础 上 完成 的 ， 那么 相同 的 16 
位 指针 就 可 以 寻 址 64MB 存储 容量 的 驱动 器 。 以 此 类 推 ， 这 种 方案 可 以 按 增加 到 2 的 任何 
整 次 震 数 量 的 扇 区 来 进行 分 配 处 理 。 就 像 苹 果 公 司 在 Mac 操作 系统 所 引入 的 许多 技术 一 样 ， 
这 并 不 是 一 项 新 技术 。 它 曾经 用 在 了 早期 的 CP/M 系统 中 。 需 要 指出 的 是 ， 按 较 大 盘 块 进行 
分 配 也 存在 一 些 问题 。 例 如 ,在 1GB 的 磁盘 上 ， 即 使 是 一 个 1 字 节 的 文件 也 会 占用 16KB 
的 磁盘 空间 ( 译 者 注 : 1GB/65 536=16KB ， 故 需 按 16KB 大 小 的 盘 块 来 进行 分 配 )。 如 果 使 
用 了 许多 短小 的 文件 ， 那 么 这 种 方式 会 变 得 非常 低 效 ， 所 以 有 必要 设计 一 种 新 的 文件 系统 来 
高 效 地 寻 址 更 大 存储 容量 的 驱动 器 。 因 此 ，8.1 版 系统 包含 了 一 个 多 级 文件 系统 的 改进 版 ， 
称 之 为 多 级 文件 系统 升级 版 ( Hierarchical File System Plus，HFS+)。 该 文件 系统 采用 32 位 
指针 ， 所 以 能 够 直接 寻 址 4GB 个 盘 块 ， 即 存储 容量 为 2TB 的 驱动 器 。 若 采用 由 32 个 扇 区 
组 成 的 盘 块 进行 分 配 ， 那 么 这 种 文件 系统 可 支持 存储 容量 最 高 达 64TB 的 驱动 器 。 另 外 ， 多 
级 文件 系统 升级 版 也 支持 长 度 为 255 字 节 的 文件 名 。 


5.10.2 ”其 他 的 硬件 变化 


笼统 地 说 是 在 计算 机 领域 ， 确 切 地 说 是 在 Mac 产品 方面 ， 相 关 硬 件 继续 更 新 换代 和 不 
断 发 展 。 自 从 摩托 罗拉 把 所 有 的 开发 工作 都 投入 PowerPC 线 上 之 后 ，8.1 版 系统 成 为 支持 
68K ( 即 68000 ) 处 理 器 的 最 后 一 版 的 Mac 操作 系统 。 另 外 ，8.6 版 系统 增加 了 增强 式 电源 
管理 ， 并 改进 了 对 诸如 通用 串 行 总 线 和 火线 ( 译 者 注 : FireWire， 一 种 高 速 输入 /输出 技术 ， 
用 来 连接 外 围 设备 与 计算 机 ， 是 高 性 能 串 行 总 线 国 际 工业 标准 的 苹果 公司 版 本 ) 等 新 的 设备 
类 型 的 支持 。 

为 了 允许 单个 应 用 程序 可 以 使 用 多 个 处 理 器 ，8.6 版 系统 引入 了 人 允许 应 用 程序 将 自身 拆 
分 为 多 个 独立 线程 (在 Mac 操作 系统 中 称 为 任务 ) 的 理念 ， 在 此 基础 上 操作 系统 就 可 以 在 
多 个 处 理 器 上 调度 运行 相关 线程 。 我 们 将 会 在 第 8 章 深入 地 讨论 这 种 技术 。 苹 果 公 司 对 超 微 
内 核 进行 了 修改 以 支持 这 种 多 线程 。 同 时 ， 有 关 操 作 系 统 还 增加 了 对 任务 相关 的 优先 级 的 支 
持 ， 这 便 允 许 应 用 程序 将 一 些 任 务 指定 为 比 其 他 任务 更 为 重要 。 进 一 步 说 ， 如 果 某 项 任务 正 
在 等 待 某 些 事件 且 相 应 事件 已 完成 ， 同 时 该 任务 的 优先 级 要 高 于 当前 正在 运行 的 任务 ， 那 么 
操作 系统 就 可 以 通过 停止 正在 运行 任务 并 启动 较 高 优先 级 的 任务 来 实现 处 理 器 的 抢占 。 我 
们 在 上 一 章 的 Palm 操作 系统 中 就 曾经 见 到 了 这 项 功能 。 然 而 ， 需 要 说 明 的 是 ,在 第 8 版 系 
统 中 尚未 发 生 进 程 抢占 现象 ， 换 名 话说 ， 有 关系 统 仍然 在 进程 之 间 使 用 协作 式 多 任务 处 理 
方式 。 


5.10.3 ”统一 字符 编码 标准 支持 


在 8.5 版 系统 中 ， 苹 果 公 司 开始 支持 一 种 新 的 机 制 ， 即 利用 一 种 所 谓 统一 码 ( Unicode， 
或 称 为 万 国 码 、 单 一 码 ) 的 全 球 化 的 字符 编码 标准 来 显示 除 英语 之 外 的 其 他 语言 。 与 处 理 字 
符 和 字符 串 数据 的 旧 的 机 制 相 比 ， 统 一 码 简 化 了 使 软件 和 其 他 语言 协同 工作 的 过 程 ， 即 所 谓 
本 地 化 〈1localization) 的 过 程 。 通 过 采用 统一 码 来 表示 字符 和 字符 串 数据 ， 对 于 每 个 可 能 的 
字符 集 而 言 ， 程 序 设计 人 员 均 可 以 仅仅 使 用 单一 的 一 套 二 进 制 文件 ， 从 而 方便 了 数据 的 交 
换 。 统 一 码 支 持 全 世界 各 种 语言 所 使 用 的 众多 文字 ， 同 时 还 涵盖 许多 技术 符号 和 特殊 字符 。 [106] 
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统一 码 可 以 表示 计算 机 使 用 中 的 绝 大 多 数 的 字符 。 它 提供 了 以 下 功能 : 

e 支持 在 一 个 文档 中 任意 的 组 合 源 自 于 各 种 语言 的 字符 组 合 。 

e 对 文字 行为 进行 了 规范 和 标准 化 。 
为 双向 文本 提供 了 标准 化 算法 。 
定义 了 到 传统 标准 的 映射 。 

e 定义 了 每 个 字符 的 语义 。 

。 定义 了 字符 集 的 若干 不 同 编码 ,包括 UTF-7、UTF-8、UTF-16 和 UTF-32。 

统一 码 可 以 采用 许多 不 同 的 方式 加 以 使 用 ， 并 且 现 在 大 多 数 的 操作 系统 都 在 这 个 级 
别 或 者 另 一 个 级 别 上 对 统一 码 给 予 了 支持 。 关 于 统一 码 的 更 全 面 的 阐述 可 以 在 统一 码 联盟 
(Unicode Consortium ， 或 称 为 统一 码 协会 ) 的 网 站 上 找到 : http://www.unicode.org。 


5.11 第 9 版 系统 


到 这 个 时 候 ，Mac 操作 系统 的 开发 已 经 变 得 异常 复杂 。 若 干 旨 在 构建 新 型 操作 系统 的 尝 
试 得 以 启动 ， 然 后 或 者 放弃 或 者 出 售 给 了 曾经 参与 合作 开发 的 公司 。 其 中 一 个 主要 事件 就 是 
对 NeXT 计算 机 及 其 所 附带 的 NextStep 操作 系统 的 收购 。 该 操作 系统 将 会 最 终 演 变 成 下 一 
版 本 的 Mac 操作 系统 ， 即 X 版 系统 ( System X， 或 称 为 第 10 版 系统 )。 与 此 同时 ，Mac 操 
作 系统 的 发 布 还 得 继续 ， 故 而 在 接 下 来 的 几 年 中 ， 由 一 个 被 取消 的 操作 系统 项 目 所 发 明 或 改 
进 的 一 些 重要 的 功能 陆续 地 被 添加 到 了 Mac 操作 系统 中 。 这 是 对 第 8 版 Mac 操作 系统 的 持 
续 稳步 的 推进 ， 于 是 版 本 号 从 8 向 上 递增 而 成 为 9， 从 而 为 过 渡 到 第 10 版 系统 铺 平 了 道路 。 
人 们 认为 ， 数 字 之 间 的 差距 有 可 能 会 阻止 某 些 用 户 从 传统 Mac 操作 系统 迁移 到 X 版 操作 系 
统 (OS X， 或 称 为 第 10 版 操作 系统 ) 上 。 第 9 版 系统 于 1999 年 发 布 ， 且 苹果 公司 称 之 为 
“有 史 以 来 最 好 的 互联 网 操作 系统 ”， 当 时 ， 互 联网 的 兴起 已 开始 从 多 个 方面 对 操作 系统 产生 
影响 。 


5.11.1 多 用 户 


起 初 ， 个 人 计算 机 是 被 假定 由 一 个 人 所 使 用 的 ， 而 且 Mac 操作 系统 就 体现 了 这 种 定位 ， 
例如 一 开始 就 没有 像 登录 这 样 的 机 制 。 有 关 设 计 假定 系统 有 唯一 的 一 个 用 户 ， 且 如 果 安 全 存 
在 问题 ， 那 么 对 相应 机 器 的 物理 访问 就 限于 那 一 个 人 。 然 而 ， 许 多 因素 纠缠 到 一 起 ， 逐 渐 削 
弱 了 这 种 假设 。 在 工作 场所 ， 用 户 共 享 机 器 是 很 常见 的 事情 ， 且 有 关 用 户 往往 只 需要 对 机 器 
进行 短 时 间 的 访问 。 在 家 里 ， 年 轻 的 家 庭 成 员 总 是 想 用 计算 机 来 玩 游 戏 ， 但 是 现在 他 们 开始 
重视 访问 互联 网 了 ， 并 需要 利用 软件 来 完成 各 种 各 样 的 作业 ， 无 论 是 写作 、 研 究 还 是 特殊 应 
用 程序 的 使 用 。 他 们 还 使 用 互联 网 来 开展 社交 联系 ， 从 多 人 游戏 、 即 时 通信 到 聊天 室 。 无 论 
在 家 里 还 是 在 企业 界 ， 他 们 中 的 每 一 个 人 都 在 系统 设置 中 拥有 不 同 的 偏好 。 相 关 设 置 包括 图 
形 化 用 户 界 面 上 的 许多 选项 以 及 浏览 器 的 主页 等 。 他 们 还 经 常 希 望 系统 上 有 些 文件 一 一 也 许 
是 个 人 日 记 一 一 对 其 他 人 来 说 是 无 法 访问 的 。 因 此 ， 在 第 9 版 系统 中 添加 了 对 多 用 户 功 能 的 
支持 。 这 要 求 每 个 用 户 在 使 用 系统 之 前 首先 得 登录 。 有 关 功 能 允许 几 个 人 共享 一 个 Mac 系 
统 ， 同 时 保护 他 们 的 私人 文件 ， 并 支持 单独 的 系统 和 应 用 程序 的 首选 项 。Mac 系统 通过 多 用 
户 控制 面板 来 进行 设置 和 维护 ， 人 允许 一 个 用 户 为 其 他 人 创建 账户 ， 并 授权 相应 用 户 可 以 正常 
访问 或 者 受 限 访问 应 用 程序 、 打 印 机 或 光盘 驱动 器 。 其 间 的 多 用 户 功 能 尚 没有 提供 在 更 现代 
的 操作 系统 或 X 版 Mac 操作 系统 (Mac OS X， 也 称 为 版 Mac 操作 系统 ， 即 Mac OS X) 
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中 可 以 找到 的 相同 级 别 的 安全 性 。 进 一 步 说 ， 后 来 的 那些 操作 系统 具备 文件 的 系统 级 别 的 安 
全 性 ， 而 第 9 版 系统 并 未 提供 此 类 安全 性 。 例 如 ， 知 识 渊博 的 用 户 可 以 通过 从 另 一 不 同 的 卷 
来 引导 从 而 实现 对 受 保护 文件 的 访问 。 不 过 ， 这 些 多 用 户 功 能 还 是 解决 了 Mac 系统 用 户 在 
共享 机 器 时 所 面 对 的 大 量 的 长 期 存在 的 问题 。 

能 够 对 某 些 用 户 的 权限 加 以 约束 是 一 种 安全 稳妥 的 做 法 。 但 令 人 遗憾 的 是 ， 许 多 用 户 对 
计算 机 不 是 很 有 经 验 ， 故 而 允许 他 们 不 受 限制 地 访问 却 可 能 意味 着 他 们 很 容易 就 会 导致 系统 
出 现 问题 。 对 于 最 低 限度 而 言 ， 他 们 有 可 能 会 因为 改变 了 什么 地 方 ， 从 而 使 他 们 不 能 正常 地 
使 用 系统 。 在 最 坏 的 情况 下 ， 他 们 则 可 能 让 整个 系统 彻底 崩溃 ， 包 括 许多 有 价值 的 数据 。 好 
的 做 法 认为 ， 即 使 是 知识 渊博 的 用 户 通常 也 不 应 该 以 无 限制 的 权限 模式 来 运行 系统 。 相 反 ， 
他 们 应 该 在 需要 执行 系统 维护 的 时 候 使 用 特殊 的 管理 登录 方式 。 

密码 是 计算 机 系统 管理 中 的 一 个 长 期 的 问题 。 鉴 于 不 同 的 应 用 程序 往往 会 拥有 许多 不 同 
的 密码 和 登录 名 ， 故 而 常常 会 导致 用 户 采 取 一 些 不 安全 的 做 法 ,例如 将 有 关 密 码 和 登录 名 写 
在 便利 贴 上 ， 然 后 将 便利 贴 粘 到 显示 器 上 。 第 9 版 系统 则 实现 了 一 种 被 称 为 密码 链 访问 的 机 
制 。 这 项 功能 对 用 户 的 多 个 标识 符 和 密码 进行 管理 ， 并 给 予 安全 存储 。 而 且 ， 一旦 用 户 通 过 
输入 相应 密码 对 密码 链 实现 了 解锁 ， 那 么 密码 链 可 感知 的 每 个 应 用 程序 就 能 够 从 密码 链 数据 
库 中 获取 特定 应 用 程序 的 正确 的 用 户 名 和 密码 ， 而 无 须 再 询问 用 户 。 

鉴于 这 时 的 文件 保护 并 不 十 分 安全 ， 所 以 第 9 版 系统 还 新 增 了 文件 加 密 功能 。 虽 然 加 密 
方案 非常 健壮 ， 但 它 是 Mac 操作 系统 专 有 的 ， 因 此 以 这 种 方式 加 密 的 文件 只 能 由 也 运行 第 9 
版 Mac 操作 系统 的 计算 机 来 实施 解密 。 如 果 Windows 或 UNIX 计算 机 上 的 接收 者 需要 解密 
相关 文件 ， 那 么 还 需要 一 种 跨 平台 的 加 密 程序 。 但 是 ， 如 果 文 件 保护 在 特定 的 多 用 户 情况 下 
尚 不 够 安全 ， 那 么 加 密 机 制 无 疑 算 是 增加 了 一 种 安全 措施 。 


5.11.2 ”网络 


到 20 世纪 90 年 代 末 ， 互 联网 取得 极 大 成 功 ， 而 TCP/IP 已 经 成 为 所 有 个 人 计算 机 的 一 
项 要 求 。 苹 果 公 司 是 从 第 7 版 系统 起 为 TCP/IP 提供 支持 的 ， 但 仅 限于 某 些 功能 ， 毕 竞 系统 
管理 人 员 更 喜欢 和 倾向 于 管理 尽 可 能 少量 的 不 同 协议 。 然 而 ， 由 于 AppleTalk 并 没有 提供 任 
何在 TCP/IP 中 也 未 提供 的 主要 功能 ， 所 以 苹果 公司 承受 了 全 面 支持 TCP/IP 所 有 网 络 功能 的 
巨大 压力 。 因 此 ， 在 第 9 版 系统 中 ,文件 共享 被 修改 为 支持 TCP/IP。 毕 竟 AppleTalk 在 互 
联网 上 没有 得 到 支持 ， 用 户 以 前 是 无 法 通过 互联 网 来 远程 访问 在 自己 的 Mac 系统 上 正在 处 
理 的 文件 的 ， 除 非 他 们 采取 相关 复杂 、 困 难 的 技术 。 相 应 地 ， 添 加 基于 TCP/IP 的 文件 共享 
支持 则 意味 着 Mac 系统 用 户 可 以 通过 他 们 的 标准 互联 网 连接 更 加 方便 地 在 家 工作 。 

此 外 ， 新 的 软件 更 新 功能 允许 用 户 通过 互联 网 来 获取 Mac 操作 系统 的 软件 更 新 ， 并 在 
有 关 更 新 可 用 的 时 候 通 知 用 户 。 这 大 大 简化 了 系统 管理 员 的 工作 。 


5.11.3 ”应 用 程序 接口 


当 第 9 版 系统 还 在 开发 的 时 候 ，X 版 操作 系统 就 已 经 起 步 了 。 正 如 我 们 很 快 将 会 看 到 
的 那样 ，X 版 操作 系统 本 质 上 是 一 种 不 同 的 操作 系统 。 然 而 ， 苹 果 公 司 并 不 希望 它 被 这 样 认 
为 。 因 此 ， 让 许多 旧 的 应 用 程序 仍然 可 以 在 新 的 操作 系统 上 执行 是 至 关 重 要 的 。 我 们 已 经 讨 
论 过 从 68000 处 理 器 架构 过 渡 到 PowerPC 处 理 器 架构 期 间 所 需 完成 的 仿真 。 类 似 地 ， 在 新 
的 操作 系统 下 执行 大 多 数 旧 版 的 应 用 程序 接口 也 是 可 行 的 ， 但 是 ， 如 果 是 通过 修改 旧 的 应 
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用 程序 来 支持 X 版 操作 系统 中 所 提供 的 应 用 程序 接口 ， 则 并 不 可 取 。 为 此 ， 蔷 果 公 司 为 第 9 
版 系统 创建 了 一 套 新 的 应 用 程序 接口 ， 使 其 向 前 兼容 X 版 操作 系统 ， 同 时 包含 了 对 大 多 数 
旧式 的 应 用 程序 接口 函数 的 支持 。 这 一 新 的 应 用 程序 接口 被 称 为 碳 式 应 用 程序 接口 (Carbon 
API)， 它 包括 对 大 约 70% 的 传统 Mac 操作 系统 应 用 程序 接口 的 支持 。 


5.11.4 视频 


计算 机 游戏 是 为 个 人 计算 机 开发 先进 强大 的 视频 功能 背后 的 驱动 力 之 一 。 虽 然 像 桌 面 排 
版 等 其 他 应 用 程序 也 可 以 受益 于 这 些 功能 ， 但 是 有 更 多 的 人 是 在 玩 游戏 ， 而 不 是 使 用 系统 来 
完成 桌面 排版 。 自 然而 然 地 ， 硬 件 厂商 希望 为 更 大 的 市 场 开 发 产品 。 全 果 计 算 机 公司 也 不 例 
外 ， 故 而 Mac 系统 提供 了 许多 游戏 。 在 第 9 版 系统 中 新 增加 的 一 项 功能 是 对 内 置 在 硬件 里 
用 来 支持 三 维 对 象 加 速 泻 染 的 视频 卡 以 及 对 诸如 OpenGL ( 译 者 注 : Open Graphics Library， 
一 套 三 维 图 形 处 理 库 ， 也 是 该 领域 的 工业 标准 ) 等 用 来 改进 视频 和 游戏 体验 的 相关 技术 的 软 
件 应 用 程序 接口 的 支持 。 


5.12 X 版 Mac 操作 系统 


在 操作 系统 发 展 史 上 ，X 版 操作 系统 可 能 是 最 具 创新 性 的 变化 之 一 ， 而 这 不 仅仅 是 因为 
苹果 公司 将 版 本 命名 从 System 10 (第 10 版 系统 ) 改 成 了 OS X (X 版 操作 系统 ， 即 第 10 版 
操作 系统 )。 更 值得 一 提 的 是 ， 在 XX 版 操作 系统 中 ， 蕴 果 公 司 完全 抛弃 了 第 9 版 系统 内 核 ， 
并 将 其 替换 为 另 一 种 内 核 。 与 此 同时 ， 微 软 的 Windows 3.x 自 1990 年 发 布 以 来 取得 了 巨大 
成 功 ， 随 后 ， 微 软 在 1993 年 还 发 布 了 另 一 个 成 功 的 操作 系统 ， 即 Windows NT。 而 NT 是 为 
高 端 应 用 程序 设计 的 高 级 操作 系统 ， 包 括 诸 如 抢先 式 多 任务 、 支 持 运行 多 种 传统 操作 系统 应 
用 程序 的 能 力 、 多 处 理 器 支持 以 及 一 种 新 型 文件 系统 等 各 项 功能 。 苹 果 公司 需要 一 种 能 与 这 
些微 软 产 品 相 匹敌 的 操作 系统 。 如 前 所 述 ， 苹 果 公 司 曾经 与 不 同 公司 在 多 个 操作 系统 项 目 中 
有 过 合作 ， 但 没有 一 个 项 目 成 功 提 供 他 们 所 需要 的 操作 系统 。 他 们 还 曾 考虑 过 在 Solaris 操 
作 系 统 (开发 厂商 为 太阳 微 系统 公司 ， 即 Sun Microsystems)、BeOS 操作 系统 (开发 厂商 为 
Be 公司 )， 据 传言 甚至 还 有 NT 操作 系统 (开发 厂商 为 微软 ) 的 内 核 之 上 来 构建 新 的 操作 系 
统 。 不 过 ， 他 们 最 终 选 定 了 建立 在 Mach 内 核 和 UNIX 衍生 版 FreeBSD 基础 之 上 的 微 内 核 
( 译 者 注 : Mach 是 由 卡 内 基 梅 隆 大 学 开发 的 用 于 支持 操作 系统 研究 的 操作 系统 微 内 核 ， 而 
FreeBSD 则 是 由 加 州 大 学 伯克利 分 校 开发 的 UNIX 版 衍生 形成 的 免费 开源 的 操作 系统 )， 同 
时 这 二 者 也 是 由 NeXT 计算 机 公司 所 开发 的 面向 对 象 的 NextStep 操作 系统 的 基础 。 出 于 性 
能 原因 的 考量 ， 一些 FreeBSD 代码 与 Mach 内 核 进 行 了 整合 ， 故 而 其 结果 并 不 是 真正 的 微 内 
核 。X 版 操作 系统 的 确切 演变 过 程 追溯 起 来 比较 困难 ， 并 且 与 本 教材 不 是 非常 关联 ， 所 以 对 
于 那些 对 各 种 不 同意 见 感 兴趣 的 人 ， 建 议 可 以 到 万 维 网 上 去 查找 更 多 大 量 的 相关 信息 。 

在 第 9 版 操作 系统 软件 中 所 做 的 更 改 ， 人 允许 在 X 版 操作 系统 中 引导 进入 传统 环境 (classic 
environment)。 因 此 ， 传 统 环境 实际 就 是 X 版 操作 系统 的 一 个 应 用 程序 ， 其 提供 了 一 个 可 
以 运行 第 9 版 操作 系统 的 兼容 层级 ， 人 允许 传统 应 用 程序 无 须 移植 到 新 的 应 用 程序 接口 上 就 
可 以 运行 在 X 版 操作 系统 上 。 这 种 设计 相当 完美 ， 不 过 传统 的 应 用 程序 依然 保持 着 它们 原 
先 的 第 8 版 或 第 9 版 操作 系统 所 支持 的 外 观 和 式样 ， 看 起 来 并 不 像 和 版 操作 系统 的 应 用 
程序 。 
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5.12.1 新 功能 


为 此 , X 版 操作 系统 实际 上 是 一 种 不 同 的 操作 系统 ， 尽 管 其 支持 以 往 在 传统 Mac 操作 
系统 版 本 中 所 使 用 的 应 用 程序 接口 。 进 一 步 说 ，X 版 操作 系统 的 许多 功能 源 自 于 UNIX 实用 
程序 软件 包 。 在 下 一 章 中 ,我 们 将 深入 探究 男 一 种 UNIX 衍生 版 操作 系统 。 在 此 ， 我们 只 简 
单 罗列 一 下 X 版 操作 系统 带 给 Mac 世界 的 一 些 特 性 : 

e 新 的 内 存 管理 系统 ， 人 允许 更 多 的 程序 同时 运行 ， 并 支持 完全 内 存 保护 ， 可 防止 程序 
彼此 间 相 互 影响 和 搞 竣 对 方 。 
命令 行 (UNIX 终端 仿真 的 组 成 部 分 )。 

在 进程 之 间 而 不 是 仅 限于 线程 之 间 的 抢占 式 多 任务 。 
支持 UNIX 文件 系统 格式 。 

阿 帕 奇 网 络 服务 器 (Apache Web server)。 

e 全 面 支持 对 称 多 处 理 。 


5.12.2 又 一 款 新 处 理 器 


鉴于 X 版 操作 系统 的 更 强大 的 功能 对 系统 资源 提出 了 更 高 的 要 求 ， 所 以 PowerPC G3 处 
理 器 是 该 版 操作 系统 的 最 低 要 求 。 

2005 年 6 月 ， 苹 果 计 算 机 公司 宣布 他 们 将 把 Mac 产品 线 从 PowerPC 处 理 器 转移 到 英 特 
尔 产品 上 。2006 年 1 月 ,苹果 计算 机 发 布 了 第 一 款 采用 英特尔 处 理 器 的 Mac 计算 机 。 传 统 
(仿真 ) 环境 在 x86 平台 的 X 版 操作 系统 中 无 法 运行 。 另 外 需要 说 明 的 是 ， 大 多 数 编写 得 很 
好 的 “传统 ”应 用 程序 在 该 环境 下 均 可 正常 运行 ， 然 而 兼容 性 只 有 在 有 关 软 件 没有 直接 与 硬 
件 进 行 交 互 上 且 仅 仅 与 操作 系统 应 用 程序 接口 打交道 的 前 提 条 件 下 才 有 保证 。 


5.13 ”小结 


在 本 章 ， 我 们 讨论 了 一 种 更 复杂 的 现代 操作 系统 一 一 由 芋 果 计算 机 公司 所 开发 的 Mac 
操作 系统 一 一 的 相关 功能 特征 和 概念 。 该 操作 系统 的 开发 是 为 了 向 市 场 推出 一 种 带 有 图 形 化 
用 户 界面 的 廉价 的 个 人 计算 机 。 其 通常 情况 下 仅 支 持 单个 用 户 , 但 后 来 的 版 本 允许 多 个 进程 
同时 运行 ， 并 支持 用 户 应 用 程序 启动 多 个 线程 。 我 们 从 第 5.1 节 对 Mac 操作 系统 的 概述 出 
发 ,开始 了 本 章 的 讨论 。 我 们 在 这 一 章 中 采用 了 一 种 不 同 的 叙述 方式 ， 即 沿 着 Mac 操作 系 
统 的 各 个 版 本 ,依次 描述 了 每 个 版 本 中 主要 的 新 功能 。 这 是 因为 Mac 操作 系统 最 初 是 一 个 
非常 简单 的 系统 ， 除 了 图 形 化 用 户 界面 之 外 ,没有 比 CP/M 提供 任何 更 多 的 功能 ， 跟 我 们 现 
在 的 想法 相 比 ， 甚 至 可 以 说 是 非常 原始 。 


然而 ，Mac 操作 系统 却 最 终 演 变 发 展 成 为 一 个 现代 的 、 功 能 齐全 的 、 能 够 支持 多 个 用 户 


和 多 个 进程 的 操作 系统 。 我 们 以 X 版 Mac 操作 系统 的 简要 说 明 结 束 了 有 关 传 奇 历程 。 下 一 
章 我 们 将 阐述 另 一 种 多 用 户 系统 ， 即 Linux 操作 系统 。 
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网 上 资源 
http://applemuseum.bott.org ( 局 外 人 有 眼 里 的 Mac 操 作 电视 广告 背后 的 著作 ) 
系统 的 发 展 史 ) http:/rolli.ch/MacPlus( 指向 vMac 的 链接 ) 
http://developer.apple.com/documentation/ ( 包含 各 种 http://en.wikipedia.org/wiki/Mac_OS_history 
链接 指向 Mac 内 部 资料 系列 文档 ， 可 按 PDF (局 外 人 了 眼 里 的 Mac 操 作 系统 的 发 展 史 ) 
格式 下 载 ) http://en.wikipedia.org/wiki/NuBus ( 最初 的 Mac 
http://developer.apple.com/technotes/ 总 线 ) 
http://www.apple-history.com ( 局 外 人 有 眼 里 的 Mac 操 作 http://en.wikipedia.org/wiki/Y2k ( 关于 “ 千 禧 虫 ” 
系统 的 发 展 史 ) 的 解释 ) | 
http://www.macos.utah.edu/documentation/operating_ http://www.parc.xerox.com/about/history/default.html 
systems/mac_os_x.html http://en.wikipedia.org/wiki/Mach_kernel ( X 版 Mac 
http:/www.online-literature.com/orwell/1984/ ( “1984” 操作 系统 的 内 核 ) 
习题 
5.1 下 面 哪 种 操作 系统 是 第 一 个 使 用 图 形 化 用 户 界 面 的 系统 ? 
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a. Xeror Star 

b. UNIX X Windows 

c. Xerox Alto 

d. Apple Lisa 

e. 以 上 选项 均 非 第 一 个 使 用 图 形 化 用 户 界面 的 系统 

苹果 公司 的 Mac 计算 机 是 在 IBM PC 之 后 开始 创建 和 引入 的 ， 而 且 要 比 后 者 稍微 便宜 一 些 。 这 是 
否 正确 ? 

Mac 系统 使 用 哪 种 处 理 器 呢 ? 

a, 摩托 罗拉 68000 系列 

b. 摩托 罗拉 PowerPC 系列 

c. 英特尔 80x86 系列 

d. 以 上 均 不 对 

e, 以 上 都 是 

与 大 多 数 其 他 个 人 计算 机 操作 系统 相 比 ，Mac 系统 拥有 的 巨大 优势 是 什么 ? 

苹果 公司 的 Lisa 系统 是 Mac 系统 的 前 身 ， 并 且 可 以 同时 运行 多 道 应 用 程序 。 最 初 的 Mac 系统 一 
次 运行 多 少 道 应 用 程序 ? 为 什么 ? 

最 初 的 Mac 系统 不 支持 可 以 防止 应 用 程序 破坏 操作 系统 或 其 数据 的 内 存 保 护 。 这 是 否 正确 ? 
最 初 的 Mac 操作 系统 支持 的 文件 夹 (目录 ) 层级 是 多 少 ? 

68000 处 理 器 一 次 能 够 寻 址 多 大 的 内 存 空间 ? 

a. 16KB 

b. 64KB 

c. 128KB 

d. 1MB 

e. 68000 处 理 器 在 任何 时 候 都 能 够 访问 所 有 的 内 存 

在 Mac 操作 系统 中 ， 内 核 以 管理 程序 模式 运行 ， 而 应 用 程序 则 在 用 户 模式 下 运行 。 这 是 否 正 确 ? 
在 Mac 操作 系统 中 实现 应 用 程序 栈 和 堆 的 方式 存在 什么 困难 ? 

Mac 操作 系统 是 如 何 避 免 上 一 道 习 题 中 所 涉及 的 问题 的 ? 

堆 内 存 管 理 的 方式 所 引发 的 问题 是 什么 ? Mac 操作 系统 是 如 何 解决 的 ? 

关于 堆 管 理 问题 ，Mac 操作 系统 的 解决 方案 与 Palm 操作 系统 有 何不 同 ? 

与 大 多 数 其 他 个 人 计算 机 操作 系统 不 同 ，Mac 操作 系统 将 大 部 分 操作 系统 本 身 都 存放 在 只 读 存 
储 器 中 。 这 是 为 什么 呢 ? 


9 
5.20 
$.21 
5:22 
$523 
5.24 
5.25 


和 $ 竟 闲 有 局 户 多 任 参 /多 线程 棍 作 系统 89 


对 于 早期 版 本 的 Mac 操作 系统 来 说 ， 剪 切 和 粘贴 操作 通常 需要 几 分 钟 而 不 是 几 秒 钟 。 有 关 操 作 
系统 的 哪 项 新 功能 改变 了 这 一 点 呢 ? 

在 习题 5.15 中 所 提 到 的 变化 是 否 使 Mac 操作 系统 成 为 一 种 多 任务 操作 系统 呢 ? 
关于 多 级 文件 系统 ， 引 入 了 哪些 主要 变化 呢 ? 

多 重 查 找 器 (MultiFinder) 是 做 什么 的 ? 

a. 它 允 许 用 户 在 文件 中 搜索 多 个 字符 串 

b. 它 允 许多 个 用 户 登 录 到 系统 

c. 它 允 许 用 户 在 网 络 中 搜索 其 他 用 户 

d. 它 像 今天 的 谷歌 一 样 搜索 互联 网 

e. 以 上 均 不 对 

第 5 版 系统 提供 了 哪些 值得 关注 的 新 功能 ? 

第 6 版 系统 支持 采用 32 位 寻 址 模式 的 Mac 新 机 型 ， 由 此 引发 了 什么 问题 呢 ? 

“ 胖 二 进 制 代码 ”有 什么 用 ? 

虚拟 内 存 使 用 软件 来 模拟 所 缺失 的 内 存 块 。 这 是 否 正确 ? 

多 线程 的 主要 用 途 是 什么 ? 

在 第 9 版 系统 的 各 种 版 本 中 添加 了 很 多 的 增强 功能 ， 请 列举 出 其 中 的 三 项 。 
我 们 为 什么 没有 过 多 地 阐述 X 版 Mac 操作 系统 ? 


第 6 章 | 


Operating Systems: A Spiral Approach 


多 用 户 操作 系统 





在 这 一 章 ， 我 们 将 讨论 一 种 比 上 一 章 所 论述 的 Mac 操作 系统 一 一 至 少 比 X 版 操作 系 
统 之 前 版 本 的 Mac 操作 系统 一 一 功能 更 为 强大 的 操作 系统 。 这 就 是 Linux 操作 系统 。 本 章 
专注 的 要 点 是 那些 根据 操作 系统 的 多 用 户 需求 而 应 当 包含 的 相关 附加 功能 ， 而 不 是 去 讨论 
Linux 操作 系统 的 所 有 方面 。 我 们 在 第 19 章 将 再 次 就 Linux 操作 系统 展开 进一步 的 讨论 ， 
着 眼 于 从 一 个 更 为 完整 的 实例 研究 的 角度 来 审视 其 用 来 支持 主要 系统 模块 的 各 种 机 制 所 做 的 
决策 。 

在 本 章 第 6.1 节 ， 我 们 将 首先 概要 介绍 Linux 操作 系统 及 其 历史 背景 。 在 第 6.2 节 中 ， 
我 们 将 讨论 多 用 户 操作 系统 的 本 质 以 及 这 一 设计 决策 是 如 何 影 响 到 操作 系统 的 相关 功能 的 。 
接 下 来 在 第 6.3 节 ， 我们 将 阐明 Linux 操作 系统 中 的 进程 和 任务 的 调度 。 我 们 已 经 在 其 他 
操作 系统 那里 见识 到 一 些 这 方面 的 功能 ， 但 是 Linux 操作 系统 是 我 们 研究 的 第 一 个 完整 地 
实现 了 进程 和 线程 的 所 有 概念 的 操作 系统 。 最 后 ， 我 们 将 在 第 6.4 节 对 全 章 内 容 进 行 归纳 


6.1 引言 


Linux 操作 系统 的 设计 是 以 UNIX 操作 系统 为 基础 的 。UNIX 操作 系统 是 一 种 早期 的 操 
作 系 统 ， 最 初 开发 主要 用 于 支持 远程 终端 (常常 是 带 有 串 行 数据 电缆 的 显示 屏 和 键盘 ) 上 的 
多 个 用 户 。 这 些 终端 与 中 央 计 算 机 系统 相连 接 ， 甚 至 可 能 通过 了 调制 解 调 器 和 电话 线 。 换 句 
话说 ，UNIX 操作 系统 最 初创 建 是 为 了 给 大 型 计算 机 开发 环境 虚拟 一 个 不 那么 昂贵 的 小 型 计 
算 机 。( 相 关 开 发 被 其 两 位 首创 人 员 作 为 某 种 业余 爱好 ， 而 他 们 二 人 则 因为 UNIX 的 概念 和 
设计 机 理 而 赢得 了 非常 著名 的 计算 机 领域 大 奖 ， 即 图 灵 奖 。) 还 有 一 些 版 本 的 Linux 操作 系 
统 ， 是 着 眼 于 许多 其 他 的 应 用 场景 。 归 纳 而 言 ， 有 关系 统 的 设计 目标 包括 : 
e 支持 在 个 人 计算 机 控制 台 上 的 单个 用 户 。 
e 担当 用 于 各 种 远程 访问 功能 (例如 文件 、 打 印 和 目录 服务 等 ) 的 服务 器 。 
e 用 作 诸 如 数据 库 管 理 系统 、 超 文本 传输 协议 ( Hypertext Transport Protocol, HTTP) 
或 网 站 (Web) 服务 器 以 及 文件 传输 协议 (File Transfer Protocol，ftp 或 FTP) 服务 器 等 
其 他 高 级 服务 的 平台 。 
e 充当 网 络 中 的 路 由 器 。 
控制 实时 系统 。 
嵌入 在 没有 直接 的 人 类 用 户 的 设备 中 。 


6.1.1 多 用 户 操作 系统 的 历史 


Linux 是 在 UNIX 的 启发 下 诞生 和 发 展 起 来 的 ， 所 以 在 介绍 Linux 操作 系统 之 前 ， 先 简 
要 讨论 一 下 UNIX 操作 系统 的 起 源 是 很 有 意义 的 。1969 年 ， 贝 尔 实验 室 ( Bell Laboratories ) 
的 肯 ' 汤 普 逊 (Ken Thompson) 开始 尝试 利用 一 台 被 废弃 的 PDP-7 小 型 计算 机 来 创建 一 个 
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多 用 户 、 多 任务 的 操作 系统 。 他 与 丹尼斯 * 里 奇 (Dennis Ritchie) 合作 ， 然 后 他 俩 和 研究 小 
组 的 其 他 成 员 一 起 创作 了 UNIX 操作 系统 的 第 一 个 版 本 ， 当 时 称 为 Unics， 帘 意 为 对 他 俩 都 
曾 参 与 的 Multics 项 目的 一 次 挖掘 。( Multics 是 一 个 庞大 的 项 目 ， 有 一 百 多 人 参加 相关 研发 
工作 , 但 人 只 有 少数 几 个 程序 设计 人 员 参 与 创建 了 UNIX。) 早期 版 本 的 UNIX 是 用 汇编 语言 编 
写 的 , 但 第 三 个 版 本 则 是 用 C 编程 语言 编写 的 ， 且 C 语言 是 由 里 奇特 意 作 为 编写 操作 系统 
的 程序 设计 语言 而 精巧 设计 的 。 进 一 步 说 ，C 被 设计 为 一 种 非常 低级 且 简 单 的 语言 ， 允 许 程 
序 设计 人 员 在 大 多 数 情况 下 忽略 许多 硬件 细节 ， 但 是 仍然 以 编译 器 可 以 利用 特殊 硬件 特性 的 
方式 来 编写 程序 。UNIX 是 开发 它 的 贝尔 实验 室 的 母 公司 ， 即 美国 电话 电报 公司 (AT&T) 的 
专利 产品 。 而 美国 电话 电报 公司 对 特许 使 用 UNIX 开展 学 术 研 究 仅 收取 适度 的 费用 。UNIX 
第 6 版 (大 约 在 1976 年 ) 对 大 学 是 完全 免费 的 ， 而 到 了 第 7 版 也 仅仅 收费 100 美元 。 有 关 
许可 费用 包括 所 有 的 源 代码 ， 并 可 随意 修改 。 不 过 ， 对 于 政府 实验 室 和 商业 实体 来 说 ， 则 必 
须 支 付 21 000 美元 。 这 对 于 当时 一 台 机 器 动 辑 数 十 万 美元 甚至 几 百 万 美元 的 费用 来 说 ， 对 
操作 系统 而 言 也 算 不 上 什么 不 合理 的 价格 。 然 而 对 于 大 学 而 言 ， 学 术 许可 证 是 一 笔 不 可 抗拒 
和 非常 诱 人 的 交易 ， 因 为 那里 有 对 知识 和 技能 充满 热切 渴望 的 学 生 ， 而 且 那 些 学 生 可 以 把 
UNIX 移植 到 其 他 机 器 上 或 者 按照 自己 的 合理 想法 对 其 进行 改进 和 提高 。 对 于 那些 通常 与 操 
作 系 统一 起 分 销 的 实用 程序 如 文本 编辑 器 之 类 的 东西 来 说 ， 尤 其 如 此 。 

作为 一 种 简单 、 一 致 、 短 小 (运行 在 几 千 字 节 的 内 存 空间 ， 源 代码 只 有 几 千 行 且 大 部 分 
是 C 代码 ) 却 非常 灵活 的 操作 系统 ，UNIX 的 魅力 是 无 法 抗拒 的 。 不 少 公 司 和 研究 团队 纷纷 
仿照 UNIX 编写 类 似 系统 ， 采 用 与 UNIX 相似 的 工作 机 理 和 运行 机 制 、 具 有 相同 的 操作 系统 
系统 调用 和 操作 系统 实用 程序 ， 但 源 代码 却 完全 重 写 (以 规避 美国 电话 电报 公司 的 所 有 权 以 
及 排除 获得 美国 电话 电报 公司 批准 的 需要 )。 

1991 年 ,芬兰 赫尔辛基 大 学 ( University of Helsinki) 计算 机 科学 专业 学 生 李 纳 斯 " 托 
瓦 效 (Linus Torvalds) 通过 课堂 作业 熟悉 了 UNIX， 并 因而 想 找 一 种 类 UNIX 操作 系统 在 家 
里 使 用 。MINIX 是 为 数 不 多 的 免费 选项 之 一 (一 本 教科 书 附 带 )， 由 安德鲁 塔 嫩 鲍 姆 
(Andrew Tanenbaum) 出 于 教学 目的 而 编写 ， 类 似 于 UNIX 但 功能 极其 有 限 。 当 然 ， 也 有 其 
他 的 一 些 类 似 UNIX 的 免费 操作 系统 ， 但 大 多 数 尚 不 成 熟 或 不 太 稳定 ， 或 者 要 求 比 大 多 数 用 
户 在 家 里 所 用 机 器 更 高 端的 硬件 条 件 。 当 托 瓦 效 使 用 MINIX 的 时 候 ， 发 觉 该 系统 少 了 许多 
功能 ， 所 以 他 决定 重 写 MINIX。 一 开始 ， 他 保留 了 原先 的 文件 系统 设计 方案 ， 但 后 来 替换 
成 了 自己 的 方案 。MINIX 运行 在 一 个 非常 基本 的 8088 处 理 器 和 软盘 上 ， 从 而 使 其 可 以 运行 
在 非常 廉价 的 硬件 系统 上 。 不 过 ， 它 却 没 有 利用 新 型 处 理 器 和 硬盘 的 功能 。 托 瓦 效 使 用 了 一 
台 基 于 英特尔 386 处 理 器 〈Intel 386 ) 的 个 人 计算 机 ， 刚 开始 时 是 添加 功能 ， 但 最 终 却 写成 
了 一 种 新 的 操作 系统 ， 且 相关 开发 最 初 是 使 用 MINIX 系统 上 的 C 编译 器 来 完成 的 。 不 久之 
后 ，Linux 就 已 经 成 为 一 个 “真正 的 ”操作 系统 。 特 别 地 ， 所 生成 的 Linux 内 核 不 再 包含 任 
何 UNIX 或 MINIX 的 代码 。 准 确 地 说 ，Linux 是 在 UNIX 接口 及 其 实用 程序 基础 上 的 完全 
重 写 。 实 际 上 ，Linux 只 是 一 个 操作 系统 的 内 核 。 它 的 构建 利用 了 位 于 马萨诸塞 州 剑桥 的 自 
由 软件 基金 会 ( Free Software Foundation ) 成 员 所 开发 的 GNU 软件 ( 译 者 注 : GNU 的 全 称 
为 GNU’s Not UNIX， 即 GNU 并 非 UNIX， 其 目标 是 创建 一 套 完 全 免费 的 操作 系统 ， 并 推 
行 软件 的 自由 使 用 、 复 制 、 修 改 和 发 布 )， 同时 还 把 大 量 的 GNU 软件 作为 相应 的 实用 程序 和 
应 用 程序 ， 从 而 确保 构成 一 套 完整 的 操作 系统 。 事 实 上 ， 操 作 系 统 的 内 核 以 外 的 主要 部 分 也 
是 GNU 计划 的 组 成 部 分 。 因 此 ，Linux 系统 更 有 意思 、 更 为 重要 的 特性 之 一 是 其 并 不 专属 
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于 一 家 公司 。 而 在 此 之 前 我 们 所 讨论 的 所 有 的 操作 系统 都 是 由 特定 的 一 家 公司 所 拥有 的 ， 所 
以 他 们 会 认为 源 代码 属于 商业 秘密 ， 且 在 一 般 情况 下 并 不 向 公众 发 布 。 但 是 ，Linux 和 GNU 
软件 都 是 “开源 ”项 目 8。 相 关 源 代码 是 免费 提供 的 ， 而 且 鼓 励 用 户 去 纠正 错误 和 增强 代码 。 
另外 ， 是 专利 性 质 的 过 程 比 开 源 模式 的 过 程 开 发 的 操作 系统 更 好 更 健壮 ， 还 是 刚好 相反 ， 关 
于 这 点 目前 存在 着 广泛 的 争论 。 

尽管 根据 有 关 准 确 说 明 ，Linux 提供 了 一 套 免费 的 支持 UNIX 操作 的 操作 系统 版 本 ， 然 
而 这 并 不 是 一 条 像 其 表面 看 起 来 那样 清晰 或 令 人 满意 的 声明 。 一 方面 (一 定 程度 上 是 因为 
UNIX 的 源 代码 针对 大 学 几乎 是 免费 的 )， 在 UNIX 开发 的 历程 中 ， 相 关 衍生 版 本 一 直 比 比 
皆 是 。 许 多 着 手 将 其 移植 到 另 一 种 环境 的 程序 设计 人 员 往 往 无 法 抵制 去 “改进 ” 某 样 东 西 
或 者 添加 某 项 最 爱 功 能 的 诱惑 。 直 到 20 世纪 80 年 代 末期 才 由 独立 的 电气 电子 工程 师 协 
会 (Institute of Electrical and Electronic Engineers，IEEE) 创立 了 一 套 相 当 标 准 的 UNIX 应 
用 程序 接口 ， 并 称 之 为 POSIX ( Portable Operating System Interface of UNIX，UNIX 可 移植 
操作 系统 接口 ) 标准 。 令 人 遗憾 的 是 ， 电 气 电子 工程 师 协 会 针对 该 标准 的 使 用 收取 大 笔 的 费 
用 ， 从 而 导致 类 UNIX 操作 系统 的 免费 版 本 的 开发 人 员 通 常 无 法 付 得 起 费用 和 让 他 们 的 产 
品 被 电气 电子 工程 师 协 会 认证 为 是 符合 POSIX 标准 的 。 为 此 ， 后 来 又 产生 了 另外 一 套 规范 ， 
即 对 于 小 公司 或 未 付费 开发 人 员 更 容易 使 用 的 单一 UNIX 规范 ( Single UNIX Specification， 
SUS ) 。 

在 Linux 操作 系统 最 初 可 供 使 用 的 时 候 ， 一 个 想 要 成 为 Linux 用 户 的 人 需要 是 某 种 意义 
上 的 UNIX 专家 ， 其 知道 需要 什么 库 和 可 执行 文件 能 够 成 功 地 让 Linux 引导 和 运行 起 来 ， 同 
时 还 要 了 解 配 置 相 关 的 细节 以 及 系统 中 某 些 文件 的 位 置 。 不 过 ,许多 潜在 的 用 户 只 是 希望 该 
系统 可 用 于 他 们 的 工作 、 爱 好 或 研究 ， 对 钻研 内 核 并 不 感 兴趣 ， 也 无 意 成 为 从 头 开 始 构建 系 
统 的 专家 。 与 此 同时 ，Linux 源 代 码 是 免费 的 ， 故 而 任何 人 都 可 以 制作 系统 的 副本 并 销售 相 
应 副本 。 因 此 , 个 人 、 大 学 和 公司 纷纷 开始 创建 Linux 操作 系统 的 发 行 版 本 ( distribution ) - 
Linux 发 行 版 通常 包括 经 过 编译 处 理 的 Linux 内 核 、GNU 系统 库 和 实用 程序 的 可 执行 代码 版 
本 。 许 多 发 行 版 还 提供 了 一 套 安装 程序 ， 这 与 其 他 操作 系统 为 给 定 机 器 定制 相应 操作 系统 所 
提供 的 安装 程序 相 类 似 。 这 种 发 行 版 最 初 只 是 为 了 方便 , 但 是 因为 节省 时 间 ， 同 时 也 可 降低 
忽略 (从 源码 出 发 构建 系统 过 程 中 的 ) 一 些小 而 重要 的 细节 的 概率 ， 所 以 ,今天 它们 已 经 成 
为 通常 的 安装 方法 ， 即 便 是 对 于 UNIX 或 Linux 大 师 也 是 如 此 。 现 在 ， 大 多 数 Linux 发 行 版 
都 被 认证 为 是 符合 单一 UNIX 规范 的 。 同 时 , 还 有 许多 不 同 的 Linux 发 行 版 是 专 为 特殊 目的 
而 设计 的 ， 例 如 从 硬盘 驱动 器 以 外 的 设备 来 启动 、 使 用 Linux 作为 服务 器 或 者 支持 不 同 的 语 
言 作 为 默认 设置 等 。 

Linux 系统 的 管理 本 身 也 是 一 个 很 有 意思 的 话题 ， 而 各 种 版 本 的 编号 则 是 Linux 的 关键 
特性 之 一 。 有 具体 而 言 ， 主 版 本 号 ( major release number) 是 其 第 一 个 整数 。 托 瓦 效 首次 发 布 
的 初始 版 本 是 版 本 0， 而 当前 版 本 是 2 ( 译 者 注 : 在 本 翻译 教材 出 版 的 时 候 ，Linux 主 版 本 
号 已 上 升 为 4)。 对 于 版 本 编号 的 第 二 部 分 而 言 ， 如 果 相应 整数 是 奇数 ， 就 表示 是 开发 版 本 
(有 时 称 为 “黑客 ”版 本 )， 而 如 果 是 偶数 ， 则 表示 是 产品 版 本 (有 时 称 为 “用 户 ” 版 本 )。 此 
外 ， 还 添加 有 另外 一 个 整数 用 来 区 分 各 种 各 样 的 补丁 级 别 。 

Linux 操作 系统 确实 远 远 超越 了 它 非常 简陋 的 开端 。 刚 开始 作为 一 个 操作 系统 内 核 时 ， 


日 “开源 ”许可 证 的 概念 有 许多 变种 或 版 本 ， 各 种 版 本 的 拥护 者 通常 对 相应 变种 把持 坚定 不 移 的 态度 。 我 们 
对 这 个 术语 则 按照 一 种 宽泛 、 一 般 的 含义 来 加 以 使 用 
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它 只 能 够 用 在 单 处 理 器 架构 下 的 英特尔 386 处 理 器 (或 更 好 的 ) 系统 上 。 然 而 现在 ， 它 可 
用 在 几乎 所 有 可 用 的 硬件 平台 上 ， 包 括 在 许多 情况 下 硬件 供应 商 提供 的 专 有 操作 系统 有 时 
甚至 是 某 版 UNIX 操作 系统 的 平台 上 -《〈 当 然 ， 一 些 实现 方案 会 比 其 他 的 实现 方案 更 好 。) 
例如 ，IBM 公司 已 经 非常 热情 地 接受 和 采用 了 Linux 操作 系统 ， 并 将 Linux 移植 到 其 所 有 4 
个 EE 系列 的 系统 线 上 。 这 一 策略 利用 了 Linux 应 用 程序 的 可 移植 性 。 目 前 ，IBM 公司 的 收 
人 的 很 大 一 部 分 来 自 于 应 用 程序 的 编写 、 安 装 和 支持 ， 而 不 是 销售 硬件 或 操作 系统 。 他 们 很 
可 能 经 常 发 现 自己 处 于 应 用 程序 的 创建 与 移植 这 一 循环 状态 中 一 一 在 他 们 的 4 个 硬件 产品 线 
中 的 某 个 硬件 产品 线 上 创建 一 个 应 用 程序 ， 然 后 便 不 得 不 把 该 应 用 程序 移植 到 其 他 的 平台 上 
供 其 他 客户 使 用 。 通 过 Linux 和 Java， 他 们 就 可 以 一 次 性 创建 应 用 程序 ， 并 轻松 地 将 它们 
(包括 利用 Linux 软件 包 、 脚 本 等 在 内 的 所 有 安装 和 支持 程序 ) 迁移 到 其 他 平台 。 


6.1.2 Linux 操作 系统 的 基本 结构 


Linux 操作 系统 使 用 的 是 整体 式 内 核 ( monolithic kernel， 或 称 为 大 内 核 )。 这 意味 着 整 
个 内 核 被 加 载 到 一 个 包含 操作 系统 所 有 模块 的 单个 程序 中 。 每 个 模块 都 可 以 直接 访问 内 核 中 
的 任何 函数 、 对 象 或 数据 结构 。 但 这 也 意味 着 整体 式 操作 系统 的 运行 效率 常常 比 微 内 核 操 作 
系统 要 更 为 高 效 。 当 然 ， 这 种 方法 也 存在 若干 隐患 和 风险 。 首 先 ， 由 于 所 有 的 操作 系统 代码 
都 运行 在 管理 程序 模式 ， 所 以 任何 错误 在 理论 上 都 可 能 会 导致 较为 严重 的 问题 。 其 次 ， 因 为 
与 特定 机 器 相关 的 部 分 不 一 定 被 很 好 地 进行 了 隔离 ， 所 以 要 移植 到 新 的 体系 结构 上 通常 比较 
困难 。 再 次 ,如果 有 关 设 计 人 员 不 太 注 意 ， 源 代码 可 能 很 快 就 会 变 得 异常 复杂 ， 因 为 这 种 内 [116| 
核 与 微 内 核 相 比 ， 在 各 模块 之 间 并 不 一 定 会 拥有 清晰 的 、 明 确定 义 的 接口 。 男 外 ， 对 于 整体 
式 内 核 来 说 ， 添 加 对 新 设备 的 支持 往往 也 比较 困难 。 通 常情 况 下 ， 需 要 编译 新 的 驱动 程序 ， 
并 重新 链接 和 重新 加 载 内 核 。 显 然 ， 这 意味 着 操作 系统 必须 得 停 下 来 和 重新 启动 一 在 多 用 
户 系 统 或 者 提供 许多 网 络 服务 、 服 务 于 许多 用 户 或 兼 有 这 两 种 情况 的 服务 器 中 都 是 不 乐意 见 
到 的 事情 。 不 过 ， 正 如 我 们 很 快 将 会 看 到 的 那样 ， 现 代 Linux 操作 系统 版 本 已 经 克服 了 许多 
这 样 的 问题 。Linux 内 核 的 结构 如 图 6-1 所 示 。 


和 人/ 输 
系统 < 了 程序 
进程 调度 程序 和 用 于 
0 | dn i 


图 6-1 Linux 系统 架构 
如 前 所 述 ， 操 作 系 统 的 另 一 种 类 型 的 组 织 是 建立 在 微 内 核 ( microkernel) 上 ， 对 应 结构 
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如 图 6-2 所 示 。 同 样 ， 这 意味 着 内 核 相关 代码 已 经 被 进行 了 最 小 化 处 理 ， 即 仅仅 包含 那些 绝 
对 必须 在 内 核 以 便于 执行 特权 指令 的 代码 。 一 般 情 况 下 ， 有 关 代 码 包括 进程 管理 、 基 本 的 内 
存 管 理 以 及 进程 间 通 信 。 而 那些 剩余 的 我 们 通常 认为 也 应 当 作为 常 驻 内 存 操作 系统 组 成 部 分 
的 功能 则 可 能 在 用 户 模式 下 运行 。 这 种 组 织 方式 有 一 些 好 的 地 方 ， 但 也 会 付出 一 定 的 代价 。 
进一步 说 ， 这 种 结构 更 易于 构建 一 个 健壮 性 的 内 核 ， 并 且 更 容易 将 其 移植 到 一 个 新 的 平台 
上 。 同 时 ， 这 种 结构 的 主要 代价 是 它 经 常会 引进 更 多 的 开销 一 一 中 断 处 理 和 上 下 文 切换 常常 
会 使 操作 系统 运行 速度 比 起 整体 式 内 核 要 慢 些 。MINIX 就 是 按照 微 内 核 系统 结构 进行 设计 
和 构建 的 。 





图 6-2 ”一 个 微 内 核 系统 架构 


6.1.3 动态 可 加 载 模块 


Linux 最 初 被 设 象 为 一 个 小 而 简单 的 项 目 。 出 于 这 种 考量 ， 似 乎 费 尽 心力 地 特意 去 创 
建 一 个 微 内 核 的 操作 系统 就 不 那么 重要 了 。 事 实 上 ， 在 早期 开发 Linux 操作 系统 的 某 个 时 
间 ， 塔 嫩 鲍 姆 曾 发 给 李 纳 斯 * 托 瓦 效 一 封 电子 邮件 ,坦言 由 于 Linux 采用 的 是 整体 式 内 核 
方法 ， 所 以 是 “过 时 的 ”。 当 时 ， 鉴 于 前 面 列 出 的 那些 理由 ， 计 算 科 学 界 的 许多 人 士 都 认为 
微 内 核 方法 是 首选 方法 。 然 而 ， 当 Linux 成 为 可 行 的 备 选 操作 系统 的 时 候 ， 托 瓦 效 和 Linux 
社区 却 提 出 了 一 种 非常 有 趣 的 方法 来 修改 或 扩充 纯粹 的 整体 式 内 核 。 其 关键 思想 是 在 2.0 
版 的 Linux 操作 系统 内 核 中 引入 的 ， 换 句 话 说， 该 版 本 支持 动态 可 加 载 模块 (Dynamically 
Loadable Module，DLM)。 有 关 设 想 允 许 基 本 内 核 包含 最 少量 的 功能 ， 并 且 在 系统 启动 运行 
之 后 通过 可 以 加 载 (和 钊 载 ) 的 模块 来 予以 “装点 ”。 进 一 步 说 ， 鉴 于 Linux 操作 系统 的 许 
多 基本 功能 可 能 不 是 在 每 次 安装 时 都 需要 ， 所 以 均 是 作为 动态 可 加 载 模块 而 开发 的 ， 具 体 包 
括 文件 系统 、 特 定 的 设备 驱动 程序 、SCSI 高 级 驱动 程序 (磁盘 、 磁 带 、 光 盘 )、 网 络 驱 动 程 
序 、 行 式 打印 机 驱动 程序 以 及 串 行 ( 电 传 打字 机 终端 ) 驱动 程序 等 功能 。 

为 了 支持 动态 可 加 载 模块 ， 核 心 内 核 必须 设立 明确 定义 的 接口 。 这 样 做 便 消 除了 对 整体 
式 方法 存 有 异议 的 一 项 重要 理由 。 当 一 个 模块 被 加 载 时 ， 它 将 调用 一 个 操作 系统 函数 把 自己 
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“注册 ”到 内 核 ， 而 要 调用 的 确切 函数 则 取决 于 要 加 载 的 模块 类 型 ， 具 体 可 参见 表 6-1 关于 
此 类 调用 所 给 出 的 一 组 解释 说 明 。 | 
表 6-1 动态 模块 注册 函数 
目 的 动态 注册 函数 
模块 init-module 


关于 动态 可 加 载 模块 接口 的 一 个 令 人 关注 的 作用 是 ， 它 允许 软件 开发 人 员 可 以 在 不 提供 
源 代码 (根据 各 种 开源 许可 证 ， 提 供 源 码 则 是 必要 的 ) 的 情况 下 为 Linux 系统 创建 增强 功能 。 
这 样 就 能 允许 Linux 依然 是 开源 项 目 ， 但 同时 也 可 包含 由 开发 人 员 保 留 为 专 有 的 功能 函数 。 

关于 动态 可 加 载 模块 的 另 一 要 点 是 ， 它 们 需要 与 核心 内 核 函 数 及 数据 结构 进行 链接 (也 
就 是 说 ， 它 们 需要 能 被 内 核 找到 ， 并 且 反 过 来 它们 也 需要 能 够 访问 内 核 的 相关 部 分 )。 这 是 
通过 将 符号 表 (symbol table) 作为 内 核 的 一 部 分 进行 加 载 来 实现 的 ， 该 表 称 为 ksym。 任 何 
将 会 在 内 核 中 公开 的 函数 或 数据 结构 均 需 在 此 符号 表 中 拥有 一 项 定义 。 而 模块 在 加 载 时 将 会 
调用 一 个 函数 来 搜索 符号 表 并 解析 正在 加 载 的 模块 中 的 所 有 引用 。 这 上 听 起 来 好 像 会 降低 系统 
的 运行 速度 ， 但 是 模块 通常 只 会 加 载 一 次 ， 然 后 就 保持 成 为 系统 的 一 部 分 。 即 使 它们 被 重复 
地 添加 和 移 除 (例如 对 于 可 移动 通用 串 行 总 线 设备 来 说 )， 但 与 处 理 器 速度 相 比 ， 一 般 情况 
下 相应 的 间隔 时 间或 许 还 是 比较 长 的 。 

也 有 可 能 是 欲 被 内 核 加 载 的 模块 想 要 公开 其 自身 的 函数 和 数据 结构 。 在 这 种 情况 下 ， 则 
可 以 利用 一 个 简单 的 功能 函数 EXPORT SYMBOL 把 相关 表 项 添加 到 符号 表 中 就 可 实现 相关 
目的 。 


6.1.4 中 断 处 理 


如 前 所 述 ，Linux 操作 系统 中 的 设备 管理 是 中 断 驱动 的 。 硬 件 中 断 是 指 相关 硬件 可 以 把 
异步 事件 (例子 如 一 个 数据 包 到 达 网 络 适配器 的 事件 ) 通知 操作 系统 的 一 种 机 制 。 具 体 而 言 ， 
当 有 关 适 配器 接收 到 数据 包 时 ， 将 会 产生 中 断 ， 从 而 使 操作 系统 可 以 停止 其 正在 完成 的 事情 
并 转 去 处 理 刚 刚 到 达 的 数据 包 。 有 些 时 候 ， 处 理 有 关 数 据 包 所 需 的 处 理 时 间 可 能 相当 宛 长 。 
或 者 ， 比 起 系统 当时 正在 进行 的 操作 ， 数 据 包 的 完整 处 理 可 能 并 不 那么 重要 。 尽 管 如 此 ， 有 
一 些 最 起 码 的 工作 确实 需要 由 内 核 立 即 完成 。 换 句 话说， 操作 系统 可 能 至 少 需要 为 可 能 到 达 
的 任何 额外 的 数据 包 分 配 新 的 缓冲 区 。 当 这 项 工作 正在 完成 的 时 候 ， 通 常情 况 下 ， 要 么 所 有 
级 别 的 中 断 均 已 禁用 ， 要 么 当前 中 断 级 别 以 及 任何 较 低 优先 级 的 中 断 已 被 禁用 。 当 然 ， 让 
中 断 禁 用 很 长 时 间或 者 让 一 些 外 部 事件 错失 并 不 是 一 个 好 主意 。 因 此 ，Linux 操作 系统 的 中 
断 处 理 程序 采用 了 一 种 众所周知 的 、 流 行 的 上 下 半 部 有 机 结合 的 组 织 结构 。 上 半 部 分 (top- 
half) 由 那些 需要 立即 发 生 的 事情 组 成 ， 而 下 半 部 分 (bottom-half) 则 是 那些 能 够 以 更 宽松 的 
时 限 来 完成 的 事情 。 同 时 ， 上 半 部 分 将 会 记录 足够 的 信息 ， 以 方便 下 半 部 分 可 以 稍 后 完成 相 
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关 工 作 。 在 Linux 的 后 续 版 本 中 ， 下 半 部 分 的 结构 被 重新 设计 并 被 赋予 了 一 个 新 的 名 称 
小 任务 (tasklet)。 之 所 以 重新 设计 ， 其 主要 原因 在 于 ， 对 于 多 处 理 器 环境 而 言 ， 小 任务 可 以 
运行 在 多 个 处 理 器 上 ， 而 原先 的 下 半 部 分 结构 每 次 只 能 由 一 个 处 理 器 加 以 执行 。 简 而 言 之 ， 
已 有 的 下 半 部 分 组 织 结构 大 部 分 都 顺应 这 种 变化 而 进行 了 重新 设计 。 


6.1.5 文件 系统 目录 树 


与 UNIX 一 样 ，Linux 操作 系统 具有 很 强 的 围绕 文件 系统 的 导向 。 许 多 根本 就 不 是 文件 
的 东西 也 会 出 现在 文件 系统 树 中 ， 如 图 6-3 所 示 。 其 中 ， 目 录 树 的 根部 显示 在 最 顶层 。 注 
意 ， 无 论 所 谓 的 proc 目录 还 是 所 谓 的 dev 目录 实际 上 都 不 是 目录 。 进 一 步 说 ， 它 们 分 别 表 
示 正 在 运行 的 进程 以 及 系统 上 的 硬件 (或 虚拟 ) 设备 。 对 这 些 名 称 的 引用 将 会 引发 Linux 操 
作 系 统 去 调用 其 他 的 函数 ， 而 后 者 将 会 返回 关于 这 些 元 素 在 被 访问 时 的 适当 的 信息 。 关 于 
这 些 内 容 具 体 将 在 第 19 章 展 开 进 一 步 的 讨论 。 另 外 ,在 图 6-3 中 还 可 以 看 到 的 其 他 令 人 关 
注 的 目录 是 /home 目录 下 的 子 目 录 ， 它 们 是 对 应 于 各 个 用 户 的 目录 。 当 一 个 用 户 登 录 进 入 
Linux 系统 的 时 候 ， 操 作 系 统 将 会 把 该 用 户 的 主 目录 设置 为 当前 工作 目录 。 
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图 6-3 Linux 操作 系统 目录 树 的 一 部 分 


6.2 多 用 户 操 作 系 统 环境 


由 于 Linux 是 仿照 UNIX 而 设计 和 开发 的 ， 且 UNIX 操作 系统 是 多 用 户 系统 ， 所 以 
Linux 操作 系统 也 是 一 个 多 用 户 系统 。 关 于 系统 存在 多 个 用 户 的 假设 ， 从 一 开始 就 引进 了 一 
个 直到 现在 我 们 都 不 必 太 过 担心 的 问题 一 一 信息 安全 。 当 只 有 一 个 用 户 可 以 使 用 一 台 计 算 机 
的 时 候 ， 有 关 操 作 系 统 通常 不 需要 关心 对 应 用 户 访问 相应 计算 机 上 的 任何 文件 的 权限 。 其 一 
般 假定 该 计算 机 的 任何 用 户 可 以 访问 任何 文件 ， 并 且 通 过 限制 对 相应 机 器 的 访问 或 者 通过 利 
用 有 关 操 作 系 统 外 部 的 实用 程序 对 文件 进行 加 密 和 实施 保护 来 提供 文件 的 安全 性 。 但 是 ， 系 
统 上 的 多 个 用 户 往往 会 同时 要 求 操 作 系 统 提供 一 种 机 制 来 保护 每 个 用 户 的 文件 免 受 其 他 用 户 
的 影响 。 这 意味 着 有 关 操 作 系 统 应 当 需 要 知道 当前 用 户 是 谁 。 自 然 地 ， 这 也 意味 着 用 户 需要 
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使 用 一 个 用 户 标 识 符 ( identifier，ID) 和 一 个 密码 登录 到 计算 机 上 。 当 然 ， 有 时 相关 用 户 会 
希望 共享 文件 ， 故 而 有 关 操 作 系统 需要 提供 允许 一 些 文件 共享 的 相关 机 制 。 所 有 的 多 用 户 系 
统 常 常 也 会 用 作 服务 器 ， 并 且 可 能 有 多 个 用 户 通过 远程 来 进行 登录 。 因 此 ， 这 些 操作 系统 也 
拥有 安全 特性 ， 具 体 将 会 在 后 面 的 章节 展开 讨论 。 还 有 ， 就 像 我 们 在 Mac 操作 系统 中 所 看 
到 的 那样 ， 当 计算 机 添加 到 网 络 中 的 时 候 ， 即 使 是 单 用 户 系统 也 需要 提供 保护 各 种 资源 的 相 
关机 制 ， 所 以 用 户 登录 等 已 经 成 为 当前 大 多 数 操作 系统 的 常见 功能 ， 即 便 仅 仅 是 为 了 网 络 访 
问 。 此 外 ，Linux 操作 系统 的 服务 器 版 本 允许 多 个 用 户 远程 访问 系统 上 的 文件 和 其 他 资源 。 
尽管 这 不 是 Linux 操作 系统 的 主要 方面 ， 但 是 同时 运行 许多 服务 和 许多 用 户 应 用 程序 的 能 力 
意味 着 其 还 必须 为 诸如 多 道 程序 和 多 线程 等 高 级 特性 提供 相应 的 支持 。 支 持 多 个 用 户 在 这 一 
领域 并 没有 引入 任何 新 的 需求 ， 但 是 Linux 操作 系统 确实 针对 这 一 问题 采取 了 一 种 不 同 的 方 
法 ,尤其 是 从 它 的 UNIX 渊源 的 角度 来 考虑 的 话 。 


6.2.1 文件 访问 权限 


Linux 操作 系统 与 其 他 类 UNIX 系统 支持 相同 的 文件 保护 和 共享 模型 。 对 于 任何 特定 的 
文件 ，Linux 操作 系统 都 将 把 所 有 用 户 视 为 三 个 集合 中 的 某 一 个 集合 的 成 员 。 其 中 ， 第 一 个 
合 只 有 一 个 成 员 ， 即 文件 的 所 有 者 。 最 开始 在 创建 文件 的 时 候 ， 文 件 的 所 有 者 就 是 创建 该 
文件 的 那个 人 。 第 二 个 集合 是 由 系统 管理 员 ( system administrator 或 sysadmin ) 对 应 人 
员 一 般 就 是 被 这 样 称呼 的 一 一 预先 定义 的 一 个 集合 。 该 集合 通常 是 对 一 组 文件 有 着 共同 兴趣 
的 一 群 用户 。 或 许 就 是 一 个 项 目 团队 ， 他 们 正在 努力 开发 一 个 新 产品 的 相关 文档 或 者 正在 使 
用 相同 的 源 代 码 ， 并 希望 在 团队 成 员 之 间 进 行 共享 。 于 是 系统 管理 员 就 可 以 按 名 称 标定 一 个 
新 的 组 别 ， 并 把 对 应 用 户 指定 为 该 组 的 成 员 。 第 三 个 集合 是 “每 个 人 ”， 但 实际 上 指 的 是 每 
个 均 非 其 他 两 个 集合 成 员 的 用 户 ， 即 “其 他 人 ”。 对 于 每 个 集合 的 成 员 而 言 ， 针 对 一 个 特定 
的 文件 ， 可 以 允许 三 种 类 型 的 访问 方式 : 读 、 写 和 执行 。 
文件 的 所 有 者 可 以 利用 一 个 名 为 chmod 的 实用 程序 来 设置 文件 的 访问 权限 。 这 条 典型 
的 令 人 费解 的 Linux 命令 代表 的 是 “更 改 文件 模式 ”。 该 实用 程序 接收 两 个 参数 ， 即 一 个 文 
件 名 和 一 个 “模式 ”， 后 者 用 于 指定 对 文件 模式 (file mode) 所 做 的 更 改 。 传 统 上 ， 有 关 模 式 
是 一 个 三 位 数 ， 且 该 数 的 每 个 数位 均 限 制 为 一 个 八进制 数字 ， 也 就 是 说 ， 数 位 的 取 值 范围 为 
0 一 7。 进 一 步 说 ， 每 个 八进制 数字 又 可 以 被 认为 是 由 三 个 二 进 制 位 组 成 的 ， 而 这 三 个 二 进 制 
位 分 别 用 于 准许 各 种 操作 一 一 读 、 写 和 执行 。 同 时 ， 模 式 的 三 位 数 分 别 给 出 三 个 集合 即 所 有 
者 、 组 别 和 其 他 人 所 拥有 的 访问 权限 。 用 来 罗列 目录 内 容 的 1s 命令 ， 可 以 列 出 一 个 文件 或 
目录 的 相应 模式 设置 。 为 此 ， 请 考虑 如 下 的 由 ls 命令 显示 的 结果 条 目 : 


-rwxr-x--x gil develop spellcheck 


这 一 条 目 描述 的 是 名 为 “ spellcheck” 的 可 执行 文件 。 该 行 的 第 一 部 分 是 访问 权限 的 设置 。 
最 前 面 的 “-” 具 有 其 他 用 途 。 最 开始 的 模式 “rwx” 适 用 于 文件 的 所 有 者 ， 在 本 例 中 即 
“gil”。 文件 的 组 别 为 “develop”， 对 应 模式 为 “r-x”"， 而 其 他 人 的 模式 为 “ --x”。 这 意味 
着 用 户 gil 对 该 文件 拥有 所 有 权限 ， 甚 至 有 权 对 其 进行 修改 或 移 除 ; 组 别 “ develop” 的 其 他 
成 员 可 以 对 该 文件 进行 读 和 执行 (如果 该 文件 是 一 个 可 执行 脚本 或 程序 )， 但 不 能 对 其 进行 
写 操作 ; 而 其 他 人 则 只 拥有 对 该 文件 的 执行 权 。 用 来 设置 这 些 访问 权限 的 chmod 命令 为 : 


chmod 751 spellcheck 





98 淄 二 部 分 浙 进 式 药 建 恕 作 夭 统 : 面向 广度 的 螺 诡 式 方 法 


其 中 ，7 对 应 于 二 进 制 数 111， 即 准许 所 有 访问 权限 ;5 对 应 于 二 进 制 数 101， 即 准许 读 和 执 
行 权限 。 

如 果 我 们 希望 准许 组 别 “ develop ”对 有 关 文 件 进 行 操作 (如 修改 等 )， 我 们 一 般 会 使 用 
另 一 个 命令 ， 即 chgrp， 寓 意 “ 改 变 组 别 ”。 进 一 步 说 ， 我 们 可 以 输入 ; 


chgrp develop spellcheck 


在 Linux 以 及 当前 其 他 的 类 UNIX 的 操作 系统 中 ,已 经 对 这 种 神 神秘 秘 的 chmod 命令 用 法 
进行 了 增强 ， 提 供 了 更 多 的 符号 参数 支持 。 例 如 ， 如 下 的 命令 : 


chmod g+w spellcheck 


用 来 为 相应 文件 所 指定 的 组 别 的 访问 权限 中 增加 写 权限 。 


6.2.2 文件 控制 块 


由 于 有 多 个 用 户 和 运行 着 多 个 进程 ， 所 以 可 能 有 两 个 或 多 个 用 户 正在 处 理 一 些 相同 的 文 
件 ， 不 过 他 们 可 能 正在 处 理 文件 的 不 同 部 分 ， 如 图 6-4 所 示 。 文 件 控制 块 相关 结构 分 为 两 部 
分 ， 以 支持 这 种 应 用 场景 并 且 力 争 信息 重复 量 最 少 。 就 像 我 们 可 以 看 到 的 那样 ， 有 一 个 系统 
范围 的 打开 文件 表 ( systemwide open file table， 简 称 系统 打开 文件 表 )， 其 位 于 内 核 中 ， 包 
含有 关 文 件 的 对 于 所 有 用 户 都 相同 的 元 数据 ， 如 第 一 个 盘 块 的 地 址 、 文 件 的 长 度 ， 等 等 。 同 
时 ， 每 个 进程 还 分 别 拥有 一 个 进程 打开 文件 表 (per-process open file table)， 其 每 个 表 项 包 
含有 一 个 指向 系统 打开 文件 表 对 应 表 项 的 索引 以 及 关于 该 进程 使 用 相应 文件 的 信息 ( 壁 如 当 
前 指针 )。 


进程 打开 文件 表 
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6.3 ”进程 和 线程 
6.3.1 Linux 任务 


我 们 还 没有 充分 地 讨论 过 线程 的 有 关 思 想 。 在 这 里 也 是 一 样 ， 因 为 Linux 操作 系统 并 
不 区 分 进程 和 线程 ， 不 过 写作 人 员 在 写 到 关于 Linux 系统 相关 内 容 的 时 候 往 往 还 是 会 使 用 
这 些 术语 ， 因 为 它们 在 其 他 地 方 会 经 常用 到 。 准 确 地 说 ，Linux 文档 采用 的 对 应 术语 是 任 
务 (task)。 在 UNIX 操作 系统 下 ， 当 一 个 进程 ( 称 为 父 进程 ) 想 要 启动 另 一 个 进程 ( 称 为 
子 进程 ) 的 时 候 ， 它 首先 会 发 出 “fork” 系 统 调 用 。 该 系统 调用 将 会 以 父 进程 副本 的 方式 


图 6-4 Linux 文件 控制 块 
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来 创建 子 进程 。( 我 们 后 面 将 会 看 到 ， 系 统 可 以 采取 多 种 方法 来 达到 这 个 目的 ， 而 且 不 用 实 
际 复制 对 应 程序 的 所 有 部 分 。) 然而 ， 对 于 Linux 操作 系统 来 说 ， 相 应 的 系统 调用 是 clone。 
就 像 所 有 的 操作 系统 一 样 ，Linux 操作 系统 为 每 个 进程 维护 着 若干 不 同 的 内 存 分 段 ， 相 关 
内 容 将 在 后 面 展 开 更 为 详细 的 描述 。 需 要 指出 的 是 ，clone 系统 调用 会 指定 一 组 标志 ， 以 告 
知 操作 系统 要 在 父 进程 和 子 进程 之 间 共 享 这 些 内 存 分 段 中 的 哪些 分 段 。 有 关 标 志 如 表 6-2 
所 示 。 


表 6-2 Linux 操作 系统 clone 系统 调用 参数 所 用 到 的 标志 


CLONE VM 共享 内 存 空间 

CLONE FILES 共享 文件 描述 符 

CLONE SIGHAND 共享 信号 处 理 程序 

CLONE VFORK 允许 子 进程 在 停止 运行 时 间 父 进程 发 信号 
CLONE_PID 共享 进程 标识 符 

CLONE FS 共享 文件 系统 


为 了 支持 为 其 他 UNIX 系统 编写 的 程序 ，Linux 操作 系统 还 必须 设法 支持 标准 UNIX 用 
于 派生 进程 的 调用 。 然 而 令 人 遗憾 的 是 ，Linux 操作 系统 提供 的 进程 复制 函数 ( clone) 并 没 
有 提供 相同 的 功能 。 进 一 步 说 ， 在 执行 clone 系统 调用 时 ， 用 于 支持 任务 的 若干 数据 结构 
(包括 访问 权限 ) 不 会 自动 地 实现 在 父 任务 和 子 任务 之 间 的 共享 。 为 此 ， 打 算 支 持 POSIX 兼 
容 性 的 相关 库 必 须 得 自己 提供 此 项 服务 。 


6.3.2 抢占 式 多 任务 

当 单 个 用 户 运行 多 道 程序 的 时 候 ， 其 中 只 会 有 一 道 程序 是 交互 式 的 。 在 这 种 情况 下 ， 如 
果 该 应 用 程序 所 使 用 的 处 理 器 时 间 比 公平 分 享 份额 多 些 ， 一 般 也 不 会 有 什么 问题 ， 因 为 在 交 
互 式 程序 中 发 生 了 一 些 宛 长 处 理 操作 的 时 候 ， 有 关 用 户 往往 也 不 会 介意 其 他 程序 是 否 时 不 时 
地 出 现 了 暂停 。 然 而， 在 多 用 户 系统 中 ,为 一 个 用 户 运行 的 程序 不 应 该 “ 粘 ” 在 处 理 器 上 和 
没完 没 了 地 运行 。 因 此 ， 与 较 高 版 本 的 Mac 操作 系统 一 样 ，Linux 操作 系统 也 是 一 种 抢占 式 
多 任务 系统 。 这 意味 着 当 有 关 操 作 系统 开始 运行 一 个 进程 的 时 候 ， 它 将 会 设置 一 个 定时 器 ， 
以 便 在 对 应 进程 运行 时 间 过 长 而 未 执行 阻塞 式 系统 调用 的 情况 下 ， 触 发 中 断 以 使 操作 系统 进 
行 处 理 。 换 句 话说， 如 果 定 时 器 超时 ,那么 当时 正在 运行 的 进程 将 会 被 放 回 到 准备 就 绪 即 将 
运行 的 进程 队列 中 〈 也 就 是 说 ， 从 对 应 进程 那里 抢占 了 处 理 器 )。 这 样 就 可 以 防止 出 现 单个 
进程 获得 对 处 理 器 的 控制 而 阻止 任何 其 他 进程 运行 的 现象 。 相 关 现象 可 能 是 源 自 于 应 用 程序 
中 的 某 个 错误 ,而 导致 相应 程序 陷入 了 死 循环 。 不过， 通常 情况 下 ， 往 往 可 能 只 是 因为 有 关 
进程 需要 完成 好 多 好 多 的 处 理工 作 。 请 注意 ， 抢 占 本 身 所 消耗 的 资源 并 不 是 用 来 完成 实际 有 
用 的 工作 一 一 它 不 是 在 代表 任何 用 户 进程 执行 什么 事情 。 尽 管 如 此 ， 它 可 以 让 有 关 用 户 获得 
更 为 流畅 的 总 体 响 应 效果 ， 并 且 通 常 被 认为 是 更 好 的 处 理 方式 ， 即 便 与 非 抢占 式 调度 比较 起 
来 它 的 效率 实际 要 略 低 一 些 。 一 般 来 说 ， 除 了 硬 实时 操作 系统 的 某 些 部 分 之 外 ， 所 有 现代 的 
操作 系统 都 采用 了 抢占 式 处 理 。 我 们 在 第 8 章 将 会 更 全 面 地 讨论 相关 问题 。 


6.3.3 ”对 称 多 处 理 
多 处 理 系 统 是 指 那些 在 单个 系统 中 运行 多 个 处 理 器 的 系统 。 这 种 体系 结构 已 经 普遍 存在 
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于 那些 没有 足够 处 理 器 电源 动力 可 用 于 运行 全 部 处 理 负 载 的 系统 上 。 就 关于 添加 一 套 完整 的 
第 二 系统 (第 二 系统 通常 必须 得 与 第 一 系统 同步 运行 ) 的 替代 方案 而 言 ， 多 处 理 不 失 为 一 种 
能 胜任 且 低 成 本 的 选择 。 其 成 本 降低 的 一 项 原因 在 于 ， 单 个 系统 可 以 共享 许多 价格 不 菲 的 硬 
部 件 ， 例 如 电源 、 主 存储 器 和 辅助 存储 器 以 及 主 系统 总 线 。 

图 6-5 显示 了 典型 的 多 处 理 器 系统 的 体系 结构 。 这 是 一 个 简化 的 示意 图 一 一 例如 ， 现 代 
系统 其 实 拥有 若干 不 同 的 总 线 。 请 注意 ， 主 存 和 输入 /输出 架构 被 所 有 处 理 器 共享 。 在 单个 
处 理 器 系统 上 ， 我们 在 任 一 给 定 的 时 刻 只 能 执行 一 道 程序 。 但 是 ,在 具有 多 个 处 理 器 的 系统 
中 ， 则 可 以 真正 地 同时 运行 两 个 或 更 多 进程 (或 线程 )。 





图 6-5 简化 的 多 处 理 器 系统 体系 结构 


大 致 从 2004 年 开始 ， 集 成 电路 设计 工程 师 确定 ， 把 多 个 处 理 器 府 和 一块 芯 片 中 而 
不 是 继续 立足 于 让 每 个 单独 的 处 理 器 变 得 越 来 越 快 ， 其 成 本 效益 可 能 更 为 合算 。 相 关 电 
路 被 称 为 紧 耦 合 多 处 理 器 (tightly coupled multiprocessor)、 芯 片 级 多 处 理 器 (Chip-level 
MnultiProcessor，CMP ) 或 多 核 处 理 器 (MultiCore Processor，MCP)。 它 们 甚至 比 以 前 已 有 
的 包含 了 多 个 单独 的 处 理 器 芯片 的 多 处 理 系统 的 耦合 程度 还 要 更 为 紧密 。 例 如 ， 多 核 处 理 器 
的 电路 通常 还 会 共享 单个 的 二 级 缓存 (L2 cache)。 这 意味 着 ， 大 多 数 像 个 人 计算 机 那样 大 的 
系统 将 会 成 为 多 处 理 器 系统 ， 但 是 在 可 预 匈 的 将 来 ， 在 腐 入 式 系统 中 ， 单 处 理 器 系统 仍 将 十 
分 常见 。 

操作 系统 可 以 采用 两 种 不 同 的 方法 来 支持 多 个 处 理 器 。 第 一 种 方法 称 为 非 对 称 多 处 理 
(asymmetric multiprocessing)。 按 照 这 种 方法 ， 操 作 系统 只 会 在 一 个 指定 的 处 理 器 上 运行 ， 
而 其 他 的 处 理 器 则 仅 会 运行 应 用 程序 。 这 种 设计 方案 的 优点 在 于 ， 操 作 系 统 本 身 可 以 撤 开 和 
不 用 考虑 关于 同一 时 间 在 两 个 处 理 器 上 运行 同一 进程 所 牵涉 的 一 些 难题 。 尽 管 非常 简单 ， 但 
是 由 于 有 关 操 作 系 统 仅仅 运行 在 一 个 处 理 器 上 从 而 造成 了 性 能 瓶颈 ， 所 以 这 种 方法 并 不 经 
常 使用。 相反 ， 大 多 数 的 现代 操作 系统 都 采用 另 一 不 同 的 方法 ， 即 对 称 多 处 理 ( Symmetric 
MultiProcessing，SMP) 来 支持 多 个 处 理 器 。 依 据 这 种 方法 ， 有 关 操 作 系 统 将 会 像 每 个 其 他 
的 进程 一 样 对 待 ， 即 可 以 在 任何 处 理 器 上 运行 。 毋 庸 置疑 ， 正 在 运行 的 程序 必然 会 修改 自己 
的 状态 (数据 )。 同 时 ， 对 于 拥有 两 个 (或 更 多 ) 处 理 器 来 运行 涉及 修改 相同 数据 的 相同 代码 
的 情况 ， 显 然 必 须 得 非常 小 心地 加 以 处 理 。 进 一 步 说， 必须 得 防止 在 不 同 处 理 器 上 运行 的 多 
个 操作 系统 实例 同时 更 改 相 同 的 数据 结构 ， 我 们 在 第 9 章 将 会 更 加 详细 地 讨论 这 个 话题 。 另 
外 ， 由 于 每 个 处 理 器 可 能 会 各 自 缓 存 相同 的 数据 ， 所 以 相关 硬件 必须 得 做 大 量 的 工作 来 确保 
所 有 的 缓存 包含 的 是 相同 的 信息 。 这 种 同步 所 涉及 的 技术 具有 较 大 的 开销 ， 从 而 使 得 大 多 数 
当前 的 系统 往往 不 会 扩展 超越 很 少数 量 的 处 理 器 规模 一 一 64 个 左右 的 处 理 器 。 

从 2.0 版 内 核 开始 ，Linux 操作 系统 已 经 支持 对 称 多 处 理 体系 结构 。 


血 6 茧 多 用 户 寿 作 系 统 101 


6.4 ”小结 


在 这 一 章 ， 我 们 讨论 了 一 个 多 用 户 操作 系统 〈 即 Linux 操作 系统 ) 的 功能 和 相关 概念 。 
本 章 相当 简短 ， 只 是 围绕 Linux 作为 多 用 户 操作 系统 而 具有 的 附加 功能 进行 了 阐述 。 第 19 
章 才 是 关于 Linux 操作 系统 组 成 模块 的 一 个 更 传统 的 案例 研究 。 

在 本 章 的 开始 ,我 们 概要 介绍 了 Linux 及 其 演变 过 程 的 点 滴 历史 。 然 后 ， 我 们 简要 讨论 
了 有 关 多 用 户 操作 系统 的 功能 特征 。 接 下 来 ， 我 们 阐明 了 Linux 操作 系统 中 的 文件 支持 ， 其 
后 ， 我 们 还 概述 了 Linux 操作 系统 中 的 进程 和 任务 的 调度 。 

在 本 书 的 下 一 章 ， 我 们 将 会 讨论 分 布 式 操作 系统 的 一 个 例子 一 一 该 操作 系统 同时 运行 在 
多 个 系统 上 ， 并 试图 让 许多 系统 作为 单一 的 环境 呈现 给 用 户 。 而 随后 的 章节 将 开始 深入 地 探 
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习题 

6.1 为 什么 在 Linux 操作 系统 中 “发 行 版 本 ”很 重要 ? 

6.2 ”为 什么 单一 UNIX 规范 对 于 Linux 操作 系统 非常 重要 ? 

6.3 ”对 于 大 型 组 织 而 言 ， 其 Linux 系统 的 标准 安装 可 能 都 不 会 希望 使 用 2.7 版 。 这 是 为 什么 ? 

6.4 Linux 只 是 操作 系统 的 内 核 ， 并 且 依 赖 于 其 他 群体 来 提供 所 需 的 实用 程序 ， 才 能 使 其 成 为 可 用 的 
操作 系统 。 这 是 否 正确 ? 

6.5 Linux 是 一 个 微 内 核 操 作 系 统 。 这 是 否 正 确 ? 

6.6 ”现代 操作 系统 往往 用 在 各 种 各 样 的 环境 中 。 对 于 Linux 系统 而 言 ， 连 接 有 令 人 难以 置信 的 各 种 各 
样 的 设备 和 控制 器 ， 涉 及 各 式 各 样 的 不 同 的 文件 系统 、 磁 盘 调 度 程 序 ， 等 等 ， 而 且 其 中 大 部 分 并 
不 需要 任何 特定 的 安装 。 像 Linux 这 样 的 操作 系统 是 如 何 避 免 因 为 在 大 多 数 情况 下 并 不 需要 的 那 
些 模块 而 过 载 的 ? 

6.7 为 什么 Linux 操作 系统 的 中 断 处 理 程序 会 划分 为 上 半 部 分 和 下 半 部 分 ? 

6.8 ”简要 描述 Linux 的 任务 复制 机 制 (clone) 与 传统 的 UNIX 进程 和 线程 的 区 别 。 

6.9 Linux 是 一 个 非 抢占 式 多 任务 操作 系统 。 这 是 否 正确 ? 126 
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并 行 分 布 式 计算 、 集 群 和 网 格 





7.1 引言 


到 目前 为 止 ， 我 们 一 直 讨 论 的 都 是 在 单 台 机 器 上 运行 的 操作 系统 的 设计 。 但 是 ,现在 
有 许多 系统 是 针对 在 许多 处 理 器 一 起 使 用 的 情况 下 的 处 理 而 设计 的 。 在 这 一 章 ， 我 们 将 讨论 
在 多 个 处 理 器 上 的 计算 以 及 我 们 如 何 管理 这 样 的 系统 。 对 于 多 处 理 器 系统 ， 有 一 些 常 见 的 构 
型 ， 但 也 有 许多 不 常见 的 构 型 。 

我 们 首先 引入 在 分 布 式 处 理 中 会 遇 到 的 几 个 关键 概念 。 然 后 ， 在 推出 这 些 概念 之 后 , 我 
们 将 会 在 第 7.3 节 闸 明 有 关 并 行 环境 中 的 计算 和 编程 的 一 些 理论 。 接 下 来 ， 在 第 7.4 节 则 会 
就 分 布 式 系统 的 常见 架构 加 以 阐述 。 鉴 于 针对 这 样 的 运行 环境 而 设计 的 操作 系统 往往 会 牵涉 
某 些 在 单 处 理 情况 下 不 会 出 现 的 特殊 的 问题 ， 所 以 在 第 7.5 节 ， 我 们 将 会 就 相关 的 操作 系统 
问题 展开 讨论 ， 具 体 包 括 如 需要 管理 什么 、 对 应 资源 管理 与 单 处理 器 系统 有 何不 同 、 向 程序 
设计 人 员 和 用 户 呈 现 什么 样 的 界面 。 其 后 ， 在 第 7.6 节 ， 我 们 将 会 引入 和 讨论 一 些 适 合 本 章 
主题 的 实际 系统 。 最 后 ， 在 第 7.7 节 对 全 章 内 容 进行 归纳 总 结 。 


7.2 关键 概念 


摩尔 定律 认为 ,计算 机 的 计算 能 力 将 逐年 增强 。 其 预言 ， 处 理 器 内 的 晶体管 数量 每 隔 
18 一 24 个 月 便 会 翻 一 倍 。 通 常情 况 下 ， 处 理 器 的 速度 也 会 相应 增加 。 而 内 存 和 磁盘 的 容量 
也 会 以 更 快 的 速率 翻 倍 。 摩 尔 定律 已 经 成 为 三 十 多 年 来 的 一 项 相当 准确 的 经 验 法 则 。 在 过 去 
的 几 年 里 ， 处 理 咒 速度 通过 利用 处 理 器 芯片 内 部 的 并 行 性 而 不 断 提 高 ， 诸 如 流水 线 
(pipelining)、 处 理 器 内 多 个 执行 单元 和 多 核 集成 电路 等 技术 已 经 在 处 理 器 速度 的 持续 提升 方 
面 起 到 了 重要 作用 。 同 时 ， 这 些 技术 对 于 程序 设计 人 员 来 说 都 是 透明 的 9 。 

然而 可 惜 的 是 ， 有 一 项 极限 一 一 光速 ， 即 每 秒 3X10 米 一 一 正在 快速 接近 。 这 意味 着 
在 3GHz 的 时 钟 速度 下 ， 在 时 钟 周期 之 间 ， 信 和 号 在 真空 中 只 能 传送 10 厘米 。 而 且 时 钟 频率 
越 高 ， 时 钟 周期 间 的 信号 传送 距离 越 短 ， 这 便 要 求 提高 晶体 管 的 密度 和 减 缩 构成 集成 电路 的 
硅 材 料 的 内 部 间距 ， 于 是 牵涉 制作 工艺 和 散热 等 一 系列 难题 。 同 时 ， 由 于 处 理 器 的 跨度 通常 
会 超过 一 厘米 ， 所 以 这 又 限制 了 处 理 咒 在 一 个 时 钟 周期 内 可 以 完成 的 工作 量 。 为 此 ， 尽 管 处 
理 器 每 年 都 在 获得 更 快 的 时 钟 和 更 快 的 处 理 速度 ， 但 是 上 述 问题 还 是 迫使 计算 机 设计 师 另 辟 
蹊 径 ， 推 行 处 理 吉 (在 芯片 上 ) 的 并 行 工作 机 制 ， 同 时 并 向 程序 员 和 用 户 (他 们 不 会 希望 为 
每 个 新 的 处 理 器 芯片 重新 设计 和 重 写 程序 ) 隐藏 有 关 实 现 细节 。 我 们 则 希望 在 更 高 级 别 (并 
行 计算 或 集群 ) 上 也 可 利用 我 们 的 计算 问题 中 的 并 行 性 ， 但 这 要 求 对 相关 程序 进行 一 些 修 
改 ， 并 需 对 操作 系统 和 中 间 件 进行 增强 。 我 们 将 围绕 这 些 问题 以 及 人 们 如 何 通过 操作 系统 和 


日 ”在 这 里 ,“ 透 明 ” 只 是 意味 着 一 道 在 没有 相关 技术 的 条 件 下 正确 运行 的 程序 ， 在 拥有 相关 技术 支持 的 情况 
下 仍然 可 以 正确 运行 。 这 并 不 意味 着 一 个 熟练 的 程序 设计 人 员 在 需要 改进 性 能 或 提供 额外 操作 的 时 候 可 
能 不 想 利 用 相关 功能 。 
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其 他 (中 间 件 ) 软件 来 利用 这 些 硬件 设施 展开 讨论 。 


7.3 ”并 行 处 理 和 分 布 式 处 理 

通常 使 用 术语 “并 行 ” 来 指 代 在 多 处 地 方 同时 进行 的 工作 ， 而 且 ， 到 目前 为 止 , 我 们 也 
确实 是 一 直 使 用 术语 “并 行 ” 来 表示 那 种 意思 。 进 一 步 说 ,我 们 可 以 采取 若干 种 可 行 的 方法 
配置 多 个 处 理 器 来 提供 并 行 性 。 在 这 一 节 中 ， 我 们 先 简要 描述 这 些 方法 之 间 的 差异 ， 后 面 我 
们 将 会 逐个 加 以 更 为 详尽 地 阐述 。 

更 确切 地 说 ， 我 们 现在 描述 的 并 行 处 理 或 并 行 计 算是 指 多 个 处 理 器 共享 一 个 大 的 内 存 
池 以 及 其 他 资源 (例如 磁盘 和 打印 机 )。 这 种 类 型 的 计算 机 体系 结构 常常 称 为 多 处 理 ( Multi- 
Processing，MP) 体系 结构 。 今 天， 大 多 数 的 多 处 理 系 统 都 运行 在 采用 对 称 多 处 理 架 构 的 操 
作 系 统 上 ， 就 像 第 6 章 中 讨论 Linux 操作 系统 时 所 提 到 的 那样 。 尽 管 多 处 理 计算 机 可 以 拥有 
共享 公共 内 存 的 任意 数量 的 处 理 器 ， 但 是 对 于 大 多 数 的 多 处 理 系 统 而 言 ， 存 在 着 如 下 一 般 性 
的 指导 准则 : 

e 处 理 器 共享 一 个 公共 的 内 存 池 ， 并 且 任 何 处 理 器 都 可 以 读 取 或 写 入 任何 内 存 位 置 

(即使 相应 内 存 位 置 正 被 另 一 个 处 理 器 所 使 用 )。 
e 所 有 处 理 器 都 具有 相同 的 类 型 和 速度 。 
所 有 其 他 计算 机 资源 (磁盘 、 网 络 和 打印 机 ) 在 所 有 处 理 器 之 间 共 享 。 
e 通常 只 有 一 个 操作 系统 副本 处 于 运行 状态 ,并 且 它 了 解 所 有 的 处 理 器 和 共享 资源 。 
(运行 多 个 操作 系统 或 让 操作 系统 只 在 一 个 处 理 器 上 运行 的 情形 极为 罕见 。) 

。 程序 必须 专门 编写 或 修改 完善 以 充分 利用 基于 多 个 处 理 器 运行 的 模式 。 

e 多 处 理 系 统 可 以 拥有 2 个 、4 个 或 更 多 (通常 为 2 的 整 次 究 ) 个 处 理 器 ， 但 是 目前 2 
个 或 4 个 处 理 器 的 多 处 理 系统 提供 了 最 佳 的 成 本 性 能 比 ( 即 每 美元 最 佳 性 能 )， 甚 至 
比 单 处 理 器 系统 的 成 本 性 能 比 还 要 好 ; 而 多 于 8 个 处 理 器 的 多 处 理 系统 则 较为 昂贵 。 
许多 机 架 式 系统 都 是 2 个 或 本 个 处 理 器 的 多 处 理 系统 。 由 于 硬件 的 原因 ， 所 以 很 少 
在 单个 系统 中 运行 64 个 以 上 的 处 理 器 9 。 

然而 ， 对 于 分 布 式 计 算 机 系统 来 说 ， 则 具有 如 下 公共 特性 : 

e 不 共享 内 存 ; 

e 常常 各 自 拥有 自己 的 资源 (如 磁盘 驱动 器 ); 

e 彼此 之 间 通 过 网 络 进行 通信 ; 

e 有 可 能 不 使 用 相同 的 硬件 ; 

。 在 每 台 机 器 上 运行 单独 的 操作 系统 副本 。 
尽管 在 分 布 式 系统 中 的 计算 机 之 间 发 送 一 条 消息 (或 共享 数据 ) 可 能 仅仅 需要 几 微 秒 , 但 是 
其 通常 比 多 处 理 系统 上 的 共享 存储 器 要 慢 上 至 少 一 百倍 。 同 样 ， 也 有 若干 不 同类 型 的 分 布 式 
系统 ， 且 每 种 类 型 都 有 独特 的 性 能 特征 。 

集群 是 一 种 特殊 类 型 的 分 布 式 系统 。 一 个 集群 由 各 个 单独 的 计算 节点 组 成 。 这 些 节点 
可 以 是 单 处 理 器 系统 ， 也 可 以 是 多 处 理 系统 。 它 们 通过 专用 软件 进行 管理 和 保护 彼此 ， 并 通 
过 专用 局 域 网 相连 接 ， 且 该 专用 局 域 网 与 将 对 应 集群 连接 到 其 他 资源 的 其 他 局 域 网 是 分 开 


日 ”有 一 些 硬 件 构 型 拥有 几 千 个 处 理 器 在 共享 内 存 。 然 而 ， 有 关 体 系 结构 并 不 是 完全 共享 内 存 。 相 关系 统 被 
称 为 非 均 匀 性 内 存 访问 (Non-Uniform Memory Access，NUMA) 系统 ， 并 不 属于 我 们 在 这 里 讨论 的 那 种 
类 别 。 
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的 。 通 常情 况 下 ， 有 关 集 群 共享 一 个 通 向 集群 外 面 的 连接 ， 且 一 般 是 连接 到 互联 网 上 。 正 常 
情况 下 ， 每 个 集群 节点 具有 与 集群 中 所 有 其 他 节点 都 相同 的 软件 和 硬件 。 不 过 ， 尽 管 不 太 
常见 ,但 是 也 有 可 能 由 非 同 一 性 的 节点 来 构建 集群 。 集 群 常常 由 单一 组 别 的 某 个 人 (或 一 群 
人 ) 来 进行 管理 ， 并 且 对 于 有 关 集 群 中 的 每 个 节点 而 言 ， 所 有 的 登录 用 户 名 和 密码 都 是 相同 
的 。 这 意味 着 一 个 用 户 可 以 使 用 单个 用 户 名 和 密码 在 一 个 或 多 个 节点 上 运行 作业 。 集 群 中 的 
节点 通常 使 用 存储 域 网 络 ( Storage Area Network，SAN) 系统 和 网 络 附属 存储 器 ( Network 
Attached Storage，NAS ) 系统 来 共享 存储 资源 。 此 二 者 本 质 上 均 是 作为 单个 联网 资源 而 使 
用 诸如 网 络 文件 系统 ( Network File System，NFS) 之 类 的 协议 进行 操作 的 磁盘 池 的 营销 术 
语 。 通 常情 况 下 ， 集 群 拥有 多 节点 作业 调度 程序 ， 其 运行 贯穿 指定 的 “ 头 节 点 ”， 支 持 作 业 、 
队列 和 工作 流 的 管理 。 一 个 这 样 的 调度 器 ， 即 轻便 型 批 处 理 系 统 ( Portable Batch System ， 
PBS)， 稍 后 将 会 在 第 7.6.6 节 展 开 讨 论 。 

网 格 (或 称 网 格 计算 机 系统 ) 由 多 个 工作 站 或 具有 不 同 管理 员 的 集群 组 成 。 故 而 ， 它 们 
不 直接 共享 资源 ， 也 不 共享 公共 登录 信息 ， 甚 至 可 能 拥有 完全 不 同 的 硬件 和 软件 配置 。 但 
是 ， 各 集群 的 管理 员 已 达成 一 致 ， 即 允许 属于 其 他 集群 或 计算 机 系统 的 用 户 的 某 些 作业 在 其 
集群 上 运行 。 

其 他 常见 的 共享 、 分 布 式 构 型 包括 点 对 点 (Peer-to-Peer，P2P) 系统 、 工 作 站 集群 (Cluster 
of Workstation，COWS) 和 志愿 计算 系统 (例如 用 于 外 星 文明 探寻 之 家 SETIQ@Home、 物 理 
学 、 生 物 学 处 理 以 及 许多 其 他 项 目的 BOINC 系统 ， 即 伯克利 开放 式 网 络 计算 平台 ， 全 称 为 
Berkeley Open Infrastructure for NetworkComputing)。 虽 然 这 样 的 构 型 对 于 一 个 开发 者 来 说 通 
常 更 加 难以 利用 ， 但 是 它们 可 以 潜在 地 提供 遍布 全 世界 的 几 十 万 个 节点 ， 计 算 能 力 超级 强大 。 

在 后 续 的 各 节 中 ， 我们 将 会 讨论 这 些 构 型 在 处 理 大 型 计算 工作 、 共 享 数据 和 处 理 、 收 集 
结果 以 及 监控 工作 进度 等 方面 的 利用 和 潜力 。 
相关 理论 入 门 

可 以 采用 工作 流 ( workflow) 来 描述 要 完成 的 工作 。 有 关 工 作 流 用 来 指定 需要 执行 的 处 
理 步 又 、 相 关 步 又 的 输入 和 输出 以 及 各 要 素 之 间 的 依赖 关系 。 通 常用 有 向 无 环 图 ( Directed 
Acyclic Graph，DAG) 来 描述 整个 过 程 ， 如 图 7-1 所 示 。 其 中 ,节点 A、B、C 和 D 被 表示 
为 方 框 ， 用 来 代表 要 执行 的 处 理 任 务 的 单位 ; 各 边 则 被 表示 为 箭头 ， 用 来 代表 处 理 节点 之 间 
的 依赖 关系 。 另 外 ， 我 们 省 略 了 用 来 描述 相关 处 理 的 输入 或 输出 。 

该 工作 流 图 表示 了 如 下 的 作业 流程 : 第 一 步 A 必须 要 处 理 一 些 数据 。 在 完成 步骤 A 之 后 ， 
可 以 运行 步骤 B 或 步骤 C。 由 于 步骤 B 和 步骤 C 之 间 不 存在 依赖 关系 ， 所 以 它们 可 以 同时 运 
行 。 在 步骤 B 和 步骤 C 都 完成 之 后 ， 则 可 以 运行 步骤 D。 例 如 ,步骤 A 读 取 一 些 数据 ， 然 
后 将 一 部 分 数据 传递 给 步骤 B， 将 一 部 分 数据 传递 给 步骤 C。 其 后 ， 步 又 B 和 步骤 C 各 自 处 
理 它 们 的 那 部 分 数据 ， 并 将 相应 的 结果 分 别传 递 给 负责 处 理 它们 
结果 的 步骤 D。 假 设 步骤 A 需要 运行 10 分钟， 步骤 B 需要 运行 
60 分 钟 ， 步 又 C 也 需要 运行 60 分 钟 ， 而 步骤 D 需要 运行 20 分 
钟 。 如 果 这 些 步骤 都 是 在 一 台 计 算 机 上 完成 的 ， 那么 运行 这 些 步 
又 所 耗费 的 总 的 时 间 为 :( 10+60+60+20 ) 分 钟 =150 分 钟 。 但 如 
果 是 在 两 台 计 算 机 上 (忽略 诸如 通信 之 类 的 开销 ) 完成 的 ， 那 么 
整个 流程 在 其 中 一 个 处 理 节点 上 的 运行 时 间 为 ( 10+60+20 ) 分 钟 
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(用 于 处 理 步骤 A 加 步骤 B 再 加 步骤 D 的 时 间 )， 在 男 一 个 处 理 节点 上 的 运行 时 间 为 60 分 钟 
(用 于 处 理 步 骤 C)， 总 共 的 处 理 时 间 也 是 150 分 钟 。 也 就 是 说 ， 无 论 哪 一 种 情况 ， 总 的 运行 
时 间 都 是 150 分 钟 ， 但 是 对 于 双 计 算 机 解决 方案 ， 实 际 已 将 “挂钟 ”时 间 (又 称 为 观察 时 间 ) 
减少 到 了 90 分 钟 ， 即 快 了 一 个 小 时 。 请 注意 ， 如 果 把 步骤 D 放 到 第 二 台 计算 机 上 运行 并 不 
会 对 整 项 工作 的 完成 有 任何 帮助 意义 ， 因 为 我 们 仍然 必须 得 等 待 步骤 B 和 步骤 C。 同 时 ， 由 
于 我 们 的 工作 流 的 依赖 关系 的 特殊 性 ， 即 便 拥有 3 个 或 4 个 处 理 节 点 也 不 会 有 额外 的 性 能 提 
升 。 进 一 步 假设 我 们 拥有 特殊 的 计算 机 可 以 更 快 地 运行 步骤 B 和 步骤 C， 那 我 们 又 能 获得 多 
少 增益 呢 ? 如 果 我 们 可 以 将 步骤 B 和 步骤 C 的 处 理 过 程 加 快 两 倍 ， 即 它们 每 个 只 需要 运行 
30 分 钟 ， 那 么 我 们 将 在 ( 10+30+20 ) =60 分 钟 内 完成 整个 工作 流程 。 这 通常 被 称 为 阿 姆 达 
尔 定律 : 对 工作 的 某 一 部 分 的 提速 将 会 使 该 部 分 更 为 迅捷 ， 但 对 于 整个 工作 流程 而 言 未 必 会 
取得 同样 的 增益 效果 。 因 此 ， 即 使 在 步 又 B 和 步骤 C 中 以 10 倍速 度 来 进行 处 理 ， 整 个 工作 
流程 的 速度 提升 亦 仅 为 : 
(10+60+20 ) 分 钟 ( 旧 ) 
(10+6+20 ) 分 钟 (新 ) =2.5 倍 

当然 ，2.5 倍 的 速度 提升 还 算 不 差 ， 但 毕竟 不 是 10 倍 (步骤 B 和 步骤 C 的 增 速 ) 的 速度 
增益 。 为 此 ， 阿 姆 达尔 定律 使 得 实际 系统 很 难 接近 并 行 计算 的 理想 效果 : 线性 加 速 。 线 性 加 速 
意味 着 在 10 个 节点 的 系统 上 完成 的 工作 比 在 单 节点 系统 上 要 
快 10 倍 ， 而 在 50 个 节点 的 系统 上 相关 工作 将 会 快 50 倍 。 有 
时 甚至 可 能 实现 超 线性 加 速 ! 在 10 个 节点 上 ， 有 关 处 理 速 度 
竟然 可 以 达到 10 倍 以 上 ! 这 是 很 不 寻常 的 ， 并 且 通 常 应 归功 于 管道 流 
内 存 中 的 缓存 效果 。 也 就 是 说 ， 在 10 个 处 理 器 运行 的 时 候 ， 我 
们 同时 配备 10 倍 多 的 缓存 内 存 ， 那 样 将 会 大 大 加 快 处 理 速 度 。 

工作 流通 常 由 两 种 结构 组 成 ， 如 图 7-2 所 示 。 

管道 流 反映 了 依赖 关系 ， 而 横扫 流 (或 称 席 卷 流 ) 则 可 横扫 流 
以 同时 并 行 地 处 理 。 大 多 数 的 工作 流 都 是 这 两 种 模式 的 组 合 。 图 7-2 管道 流 和 横扫 流 
一 个 非常 有 价值 的 源 自 直觉 的 结论 是 管道 流 的 某 一 部 分 实际 
上 可 以 允许 分 步 处 理 的 条 件 ， 即 (一 个 处 理 节点 上 ) 有 关 管 道 流 的 某 一 阶段 可 以 按 每 次 一 条 
记录 的 方式 来 处 理 数据 ， 然 后 将 相关 结果 传递 到 下 一 阶段 ， 而 后 者 便 可 以 立即 开始 处 理 对 应 
记录 ， 与 此 同时 ， 有 关 管 道 流 进程 的 前 一 阶段 则 可 以 并 行 处 理 下 一 条 记录 。 

关于 工作 流 ， 存 在 如 下 若干 令 人 关注 的 测量 指标 : 

se 工作 时 间 一 一 指 在 所 有 节点 上 用 来 处 理 有 关 工 作 的 时 间 总 和 。 

e 挂钟 时 间 (或 称 时 钟 时 间 ) 指 处 理 有 关 工 作 从 开始 到 完成 所 经 过 的 时 间 。 

e 利用 率 (或 称 资源 利用 率 ) 指 每 个 节点 处 于 忙碌 状态 的 时 间 百 分 比 (或 所 有 节点 

处 于 忙碌 状态 的 时 间 百 分 比 的 平均 值 )。 
e 吞吐 量 一 一 指 每 小 时 (或 每 天 ) 运行 的 作业 量 或 工作 流 进程 数量 。 


7.4 分 布 式 系 统 体系 结构 
7.4.1 执行 环境 概述 
在 各 种 分 布 式 系统 体系 结构 和 单 处 理 器 、 多 任务 系统 之 间 存在 着 显著 的 差异 。 虽 然 每 种 
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体系 结构 均 允 许 我 们 并 行 地 运行 作业 ， 但 是 为 了 利用 任何 一 种 特定 的 体系 结构 ， 我们 必须 付 
出 的 努力 与 利用 其 他 架构 所 需 付 出 的 努力 相 比 ， 有 着 相当 大 的 不 同 。 为 此 ， 本 节 将 更 为 详细 
地 讨论 每 一 种 相关 可 能 的 体系 结构 ， 以 便 我 们 能 够 更 好 地 理解 其 间 可 能 发 生 的 一 些 问题 。 
正如 我 们 在 先前 的 讨论 中 所 看 到 的 ， 当 我 们 利用 更 先进 的 功能 时 ， 我 们 往往 需要 小 心 相 
应 的 副作用 以 及 不 同 功能 之 间 的 交互 问题 。 例 如 ， 请 回想 一 下 为 支持 更 高 效 的 计算 机 资源 使 
用 而 引入 的 并 发 运行 若干 进程 的 能 力 。 但 是 其 同时 也 引入 了 进程 间 通 信 的 难题 ， 因 为 我 们 在 
进程 之 间 建 立 有 那么 多 的 分 离 和 保护 机 制 。 然 后 ， 我 们 在 共享 资源 时 还 需要 上 锁 和 开锁 ， 以 
避免 可 能 出 现 的 冲突 问题 。 之 后 ， 我 们 又 会 担心 由 于 锁 的 使 用 而 可 能 产生 的 死 锁 问题 。 


7.4.2 对称 多 处 理 系 统 


由 于 对 称 多 处 理 系统 共享 内 存 ， 所 以 处 理 大 量 数据 并 在 各 阶段 之 间 传 递 数 据 或 者 共享 
数据 表 的 应 用 程序 可 以 从 基于 这 种 架构 的 运行 过 程 中 大 大 受益 。 为 此 ， 有 许多 常见 程序 ( 软 
件 工 具 ) 的 并 行 版 本 。 或 许 你 还 记得 ， 在 对 称 多 处 理 系统 中 ， 只 有 一 个 操作 系统 的 副本 在 运 
行 ， 且 其 可 以 在 任何 可 用 的 处 理 器 上 运行 。 它 必须 管理 每 个 处 理 器 的 进程 调度 以 及 内 存 分 配 
(只 有 一 份 共享 的 物理 内 存 空间 ) 和 其 他 资源 (磁盘 、 终 端 等 )。 那 么 ， 如 何 利 用 对 称 多 处 理 
系统 来 并 行 工作 呢 ? 此 类 系统 如 图 7-3 所 示 。 





图 7-3 多 处 理 系统 


一 般 可 以 采用 两 种 主要 的 技术 来 利用 对 称 多 处 理 系 统 的 优势 : 多 处 理 和 多 线程 。( 这 两 
种 技术 之 间 的 区 别 将 会 在 第 8 章 加 以 讨论 。) 如 果 这 看 上 去 有 点 熟悉 ， 那 是 因为 大 多 数 现代 
的 操作 系统 (譬如 Linux 和 Mac 操作 系统 ) 都 提供 有 相同 的 设施 ， 正 如 我 们 在 前 面 所 讨论 的 
那样 。 使 用 对 称 多 处 理 系 统 的 关键 之 处 在 于 它 与 传统 的 单 处 理 器 计算 机 非常 相似 ， 只 是 具有 
更 大 的 主 存 容量 和 更 多 的 处 理 器 而 已 。 

从 程序 设计 人 员 的 角度 来 看 ， 利 用 多 个 处 理 器 的 能 力 可 以 通过 简单 地 将 整个 系统 划分 成 
作为 单独 进程 运行 的 许多 单独 程序 来 实现 。 这 往往 意味 着 运行 至 少 与 系统 中 的 处 理 器 一 样 多 
的 进程 。 然 而 通常 情况 下 ， 我 们 运行 的 进程 数 会 比 处理 器 数量 更 多 一 些 ， 这 是 考虑 到 当 其 他 
进程 被 阻塞 和 处 于 等 待 状态 的 时 候 ， 有 一 些 进 程 可 以 运行 。 一 般 而 言 ， 一 道 已 经 被 设计 和 编 
写成 创建 许多 进程 同时 运行 的 程序 或 工作 流 (一 组 程序 / 进程 ) 可 以 在 单 处 理 器 计算 机 上 正 
常 运行 。 但 是 ， 它 们 也 可 在 对 称 多 处 理 系统 上 正常 运行 ， 没 有 任何 变化 ， 只 是 会 更 快 一 些 。 
(当然 ， 在 某 些 不 太 常见 的 情况 下 一 一 例如 对 于 几乎 所 有 进程 都 被 阻塞 和 等 待 输 入 的 情况 来 
说 一 一 常常 不 会 有 任何 加 速 的 收益 。) 虽然 这 种 并 行 方法 已 经 很 常见 ， 但 是 让 多 个 进程 共享 
数据 还 是 会 存在 一 系列 困难 或 难题 ， 例 如 前 边 提 到 的 竞 态 条件 。 毋 庸 置疑 ， 进 程 间 通 信和 同 
步 可 以 解决 许多 问题 ,但 是 由 此 所 产生 的 开销 却 应 当 尽 量 通过 其 他 方法 来 予以 避免 。 如 果 相 
关 工作 任务 可 以 划分 为 不 需要 很 多 的 进程 间 通 信和 同步 操作 的 集合 (例如 ， 划 分 成 若干 如 前 
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所 述 的 横扫 工作 流 )， 那 么 多 进程 模型 就 可 以 更 好 地 发 挥 效用 。 

既然 这 样 ， 相 对 于 其 在 单 处 理 器 上 所 做 的 一 切 ， 操 作 系统 又 应 当 如 何 来 管理 对 称 多 处 理 
系统 上 的 多 处 理 或 多 线程 呢 ? 结果 证 实 ， 并 没有 太 大 的 差别 。 鉴 于 内 存在 一 个 大 池 中 进行 共 
享 ， 所 以 相应 的 内 存 管理 与 单 处 理 器 计算 机 上 的 内 存 管理 是 相同 的 。 就 处 理 器 调度 而 言 ， 要 
” 比 单 处 理 器 系统 更 为 复杂 ， 因 为 附加 的 处 理 器 必须 得 单独 处 理 。 不 过 ， 就 像 单 处 理 器 系统 一 
样 ， 时 间 片 调度 策略 也 常常 用 在 对 称 多 处 理 系 统 中 ， 故 而 使 得 相应 设计 方案 的 某 些 部 分 并 没 
有 很 大 的 不 同 。 但是， 调度 器 必须 得 考虑 在 哪里 调度 和 执行 进程 ， 因 为 相关 任务 可 能 被 发 送 
到 不 同 的 处 理 器 上 。 然 而 ， 这 并 不 会 比 单个 处 理 器 的 调度 困难 许多 。 可 是 ， 处 理 器 体系 结构 
的 一 项 最 新 进展 则 可 能 使 有 关 调 度 变 得 复杂 起 来 。 请 回想 一 下 ， 大 多 数 的 处 理 器 在 其 芯片 上 
都 具有 访问 速度 更 快 的 高 速 缓存 存储 器 ， 其 中 包含 有 主 存 部 分 内 容 的 副本 。 如 果 调 度 器 随机 
地 将 进程 和 线程 分 配给 各 个 处 理 器 ， 那 么 高 速 缓存 的 好 处 将 大 打折 扣 。 是 的 ， 整 个 系统 仍 将 
正常 运作 ， 但 是 其 运行 速度 将 会 比 相 应 数据 在 合适 处 理 器 的 缓存 中 的 情况 要 慢 得 多 。 一 旦 相 
关 进 程 和 线程 已 经 启动 ， 精 致 设计 的 对 称 多 处 理 调度 程序 往往 会 试图 保持 进程 (或 来 自 一 个 
进程 的 多 个 线程 ) 自 其 启动 以 来 就 一 直 运 行 在 同一 个 处 理 器 上 。 这 被 称 为 处 理 器 偏好 ( CPU 
preference) 或 处 理 器 亲 和 性 ( processor affinity)。 这 项 技术 还 允许 程序 设计 人 员 或 管理 员 向 
调度 器 提供 建议 ， 以 在 特定 的 处 理 器 上 运行 进程 或 线程 。 

对 称 多 处 理 操作 系统 面临 的 另外 一 个 问题 是 可 能 有 操作 系统 的 多 个 副本 在 同时 运行 ， 且 
这 些 副 本 可 能 会 尝试 同时 更 新 相同 的 数据 。 因 此 ， 对 称 多 处 理 操作 系统 必须 得 使 用 锁定 机 制 
来 防止 不 同 的 执行 副本 相互 干扰 。 这 一 问题 将 会 在 第 9 章 展开 更 全 面 的 讨论 。 


7.4.3 集群 


与 对 称 多 处 理 系 统 相 比 ， 集 群 系统 的 耦合 性 更 为 松散 些 。 它 们 往往 在 每 个 节点 上 拥有 基 
本 相同 的 系统 软件 以 及 关于 进程 间 共享 和 通信 的 若干 选项 。 相 应 示例 如 图 7-4 所 示 ， 其 中 有 
两 组 系统 ， 每 组 系统 均 由 紧密 耦合 的 两 套 系统 组 成 (图 中 ， 处 理 器 编号 为 奇数 的 两 套 系统 为 
一 组 ， 而 处 理 器 编号 为 偶数 的 两 套 系 统 为 另 一 组 )， 且 这 两 组 系统 之 间 具 有 附加 的 耦合 关系 。 
另外 ， 每 套 系统 都 有 本 地 内 存 和 本 地 存储 器 。 集 群 通常 由 单一 的 机 构 (例如 公司 或 大 学 ) 进 
行 管理 。 它 们 依赖 于 中 间 件 (middleware)， 即 用 来 推进 系统 之 间接 口 更 加 便利 但 并 非 操作 
系统 组 成 部 分 的 软件 一 一 其 位 于 操作 系统 和 应 用 程序 之 间 的 “中 间 层 ”上 。 中 间 件 试图 提供 
有 关 通 过 独立 于 所 涉及 的 底层 操作 系统 的 方式 来 促进 分 布 式 处 理 的 抽象 机 制 。 它 们 被 认为 是 
平台 无 关 的 (platform agnostic)。 这 便 允许 我 们 在 其 中 ， 也 可 以 把 现 有 的 系统 连接 到 一 起 ， 
并 且 让 对 应 中 间 件 来 解决 处 理 相关 的 差异 问题 。 不 过 ， 中 间 件 也 可 以 在 同 构 的 集群 中 加 以 
使 用 。 

常见 的 中 间 件 软件 包 包 括 MPIUPVM (Message Passing Interface/Parallel Virtual Machines， 
消息 传递 接口 /并 行 虚拟 机 )、CORBA ( Common Object Request Broker Architecture， 通 用 
对 象 请 求 代理 体系 结构 )、DCOM ( Distributed Component Object Model， 分布 式 组 件 对 象 模 
型 )、.net 远程 处 理 ( .net remoting) 以 及 Java/RMI ( Remote Method Invocation， 远 程 方法 
调用 )。MPI/PVM 提供 了 一 种 与 语言 无 关 的 方式 来 支持 进程 与 有 关 集 群 中 的 其 他 节点 上 的 
其 他 进程 之 间 进 行 消息 、 数 据 和 参数 的 发 送 或 接收 ， 即 使 相关 进程 是 采用 不 同 的 编程 语言 
所 编写 的 。CORBA 是 类 似 的 ， 但 其 允许 一 个 对 象 去 调用 驻 留 在 另 一 不 同 计 算 机 上 的 另 一 个 
对 象 的 方法 。RMI 与 CORBA 相 类 似 ,但 仅 限于 Java 语言 。DCOM 则 提供 了 一 种 用 来 调用 
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由 微软 产品 所 创建 的 远程 对 象 上 的 方法 的 途径 。 它 被 认为 是 一 种 二 进 制 机 制 ， 而 不 是 一 种 
像 CORBA 或 RMI 那样 的 面向 语言 的 机 制 。 这 意味 着 它 通过 确定 某 种 与 远程 对 象 上 的 分 支 
表 等 同 的 方法 来 寻找 其 相应 的 目标 接口 。 由 于 微软 操作 系统 的 广泛 存在 ， 所 以 DCOM 也 已 
经 在 大 多 数 其 他 的 操作 系统 上 提供 了 相应 的 实现 和 支持 。 尽 管 如 此 ， 这 是 一 种 相对 陈旧 的 机 
制 ， 虽 然 由 于 其 如 此 广泛 的 使 用 故而 仍然 给 予 了 支持 ， 但 新 的 项 目 开发 往往 不 狗 成 采用 这 种 
机 制 。 进 一 步 说 ， 新 的 项 目 开发 一 般 都 转向 采用 .net 远程 处 理 方法 。 





图 7-4 集群 多 处 理 系统 


这 些 中 间 件 软件 包 人 允许 那些 没有 直接 共享 内 存 的 进程 相互 之 间 进 行 信息 的 传递 一 一 集群 
的 理想 模式 。 但 是 ， 这 些 中 间 件 机 制 实 际 上 更 适用 于 一 般 的 分 布 式 计算 而 非 集群 计算 。 对 于 
为 利用 计算 集群 的 并 行 性 而 设计 的 程序 来 说 ， 则 可 以 运用 有 关 操 作 系 统 的 其 他 特定 的 集群 接 
口 ， 壁 如 PBS 集群 调度 命令 ,具体 在 后 面 进行 讨论 。 


7.4.4 计算 网 格 


网 格 甚 至 比 集群 的 耦合 性 还 要 松散 。 它 们 是 各 个 节点 或 由 不 同 机 构 管 理 的 集群 的 松散 
聚集 。 网 格 计算 的 主要 优点 在 于 ， 每 个 节点 都 可 以 是 廉价 的 计算 机 ， 而 通过 将 它们 组 合成 网 
格 ， 就 能 够 以 较 低 的 成 本 产生 类 似 于 多 处 理 器 的 超级 计算 机 的 计算 能 力 。 相 对 于 构建 少量 的 
单一 用 途 的 超级 计算 机 的 较 高 的 成 本 ,生产 日 常 普通 的 硬件 商品 还 是 非常 经 济 的 ， 所 以 其 低 
成 本 优势 特别 明显 。 同 时 ， 其 最 大 的 缺点 是 相关 节点 不 具备 高 速 、 低 延迟 的 相互 连接 机 制 。 
因此 ， 这 种 处 理 方案 最 适用 于 那些 许多 并 行 计 算 独 立 进 行 的 应 用 程序 。 

通常 情况 下 ， 网 格 中 的 节点 不 会 共享 用 户 登 录 和 密码 ， 而 且 相 关节 点 往往 具有 不 同 的 配 
置 。 尽 管 如 此 ， 它 们 一 般 都 会 运行 相同 的 操作 系统 。 鉴 于 系统 内 部 的 连接 非常 松散 ， 所 以 无 
论 是 多 线程 还 是 MPI、RMI， 亦 或 类 似 的 中 间 件 机 制 都 不 能 在 网 格 系统 中 实现 有 效 的 任务 分 
配 、 数 据 共享 或 工作 进度 监控 。 一 个 由 工业 界 、 学 术 界 和 其 他 相关 各 方 组 成 的 联合 体 共 同 构 
建 了 一 套 免费 使 用 的 Globus 工具 包 (或 称 格 洛 伯 斯 工具 包 )， 广 泛 用 来 管理 计算 网 格 。 该 软 
件 包 是 支持 集群 管理 员 将 他 们 的 某 些 资源 作为 网 格 的 组 成 部 分 予以 共享 的 一 组 实用 程序 、 接 
口 和 协议 。 
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由 于 相关 节点 是 分 开 管理 的 ， 所 以 安全 性 是 网 格 系统 的 一 个 大 问题 。 出 于 安全 的 考量 ， 
对 于 相关 作业 而 言 ， 通 常 由 票据 授予 机 构 ( ticket granting agency) 来 授 发 “人 网 券 ”， 而 不 
是 为 其 创建 临时 的 用 户 登 录 名 。 许 多 不 同 的 行政 机 构 将 会 参与 给 定 网 格 的 管理 。 各 管理 人 员 
一 致 信任 的 任何 来 源 便 可 以 成 为 票据 授予 机 构 。 在 网 格 中 的 节点 之 间 传 输 数 据 和 程序 、 预 留 
本 地 空间 以 及 检索 结果 均 通 过 Globus 命令 和 接口 来 完成 。 显 然 ， 站 点 (集群 ) 之 间 的 协调 比 
在 单个 集群 上 更 为 困难 ， 故 而 仅 有 极 少数 软件 设计 成 是 启用 网 格 方式 的 。 除 了 Globus 之 外 ， [135 
还 有 许多 其 他 的 系统 也 是 为 支持 网 格 计算 而 设计 的 。 


7.4.5 志愿 计算 


全 世界 的 个 人 控制 着 数 百 万 台 的 计算 机 ， 且 这 些 计 算 机 在 大 部 分 时 间 里 都 无 所 事 事 。 即 
使 是 在 运行 所 指定 任务 的 情况 下 ， 大 多 数 的 个 人 计算 机 仍 有 许多 未 被 利用 的 处 理 器 周期 ， 这 
往往 是 由 于 需要 等 待 输入 /输出 任务 完成 而 造成 的 。 多 年 来 ,一 些 大 项 目 一 直 希 望 能 够 利用 
在 这 些 计算 机 上 的 那些 被 浪费 掉 的 计算 时 间 。 于 是 ,设计 开发 了 许多 独特 的 系统 ， 以 试图 
利用 这 种 不 用 就 会 被 浪费 掉 的 计算 机 处 理 能 力 。 这 些 系统 需要 处 理 好 几 方 面 的 问题 ， 包 括 
允许 个 人 在 系统 中 注册 他 们 的 计算 机 、 为 那些 计算 机 寻找 合适 作业 、 在 对 应 计算 机 需要 完 
成 其 他 更 重要 任务 的 情况 下 允许 暂停 相关 作业 、 把 结果 返回 给 发 起 者 、 记 录 和 监测 每 个 用 
户 或 用 户 组 已 经 积累 的 “信用 额度 ”。 最 后 ， 威 斯 康 星 大 学 ( University of Wisconsin) 的 
Condor 项 目 和 伯克利 的 BOINC 成 功 开 发 了 通用 的 基础 设施 ， 可 支持 许多 不 同 的 项 目 按 
以 上 模式 运作 ， 且 不 需要 针对 每 个 项 目 从 头 白手 起 家 来 开发 相关 基础 设施 。 尽 管 二 者 都 提 
供 了 聚集 许多 不 用 就 会 被 浪费 掉 的 计算 机 资源 的 可 能 性 ， 但 是 它们 还 是 具有 一 些 重要 的 
区 别 。 

大 多 数 的 志愿 计算 项 目 都 是 基于 参数 横扫 流 的 ， 其 中 大 量 的 数据 被 分 解 成 小 的 数据 集 并 
被 发 送 到 志愿 者 的 计算 机 上 。 这 些 计算 机 都 运行 着 相同 的 科学 程序 来 分 析 其 自己 的 特定 的 数 
据 集 ， 然 后 将 结果 发 回 。 每 轮 横扫 所 完成 的 工作 量 通常 也 就 几 个 小 时 ， 并 且 开 始 启 动 时 发 送 
给 志愿 者 的 数据 和 完成 结束 时 发 送 回 服务 器 的 结果 通常 都 不 会 太 大 ( 几 十 万 字 节 到 几 百 万 字 
节 )， 从 而 使 志愿 机 器 负载 不 会 太 重 。 同 时 ， 如 果 作 业 由 于 某 种 原因 而 异常 终止 ， 也 不 会 损 
失 太 多 的 处 理 结果 。 

BOINC 

如 果 一 个 项 目的 计算 工作 可 以 被 划分 为 合理 大 小 的 分 块 ， 并 且 使 用 数 百 万 台 志 愿 计 算 机 
将 可 能 推动 有 关 项 目 ， 那 么 BOINC 基础 设施 将 是 颇具 吸引 力 的 。BOINC 提供 了 通用 的 基础 
设施 ， 并 允许 项 目 提交 计算 应 用 程序 以 运行 在 数 百 万 台 当 前 存在 着 未 被 利用 的 处 理 器 周期 的 
用 户 计算 机 上 。 

由 于 早期 的 志愿 计算 系统 所 取得 的 成 功 ，BOINC ( Berkeley Open Infrastructure for Net- 
work Computing， 伯 克利 开放 式 网 络 计 算 平台 ) 还 创建 了 一 套 基础 设施 ， 可 支持 把 任何 软件 
系统 分 发 到 数 百 万 台 志 愿 计算 机 上 共同 完成 。BOINC 由 发 出 工作 任务 和 接收 处 理 结果 的 服 
务 器 系统 组 成 。 它 可 以 配置 成 是 使 用 任何 志愿 计算 机 或 者 优先 选用 有 关 软 件 已 被 安装 且 运 
行 Linux 或 Windows 操作 系统 的 计算 机 。BOINC 客户 端 部 分 被 发 送 到 志愿 的 客户 端 计算 机 
上 ， 然后 由 其 负责 下 载 实际 的 科学 应 用 程序 。 当 用 户 向 BOINC 注册 时 ， 他 们 可 以 选择 他 们 
想 要 参与 的 科学 项 目 以 及 应 当 把 哪 部 分 空闲 周期 用 到 每 个 项 目 上 。 接 下 来 ，BOINC 客户 端 
软件 将 会 处 理 其 余 的 问题 。 它 会 安排 科学 应 用 程序 何 时 运行 ， 有 可 能 是 对 应 计算 机 在 特定 的 
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一 段 时 间 内 的 任何 空闲 时 间 ， 也 有 可 能 一 直 在 后 台 利 用 空闲 处 理 器 周期 运行 。BOINC 客户 
端 还 将 跟 服 务 器 一 起 检查 和 保持 科学 应 用 程序 的 版 本 为 最 新 版 本 、 处 理 与 服务 器 之 间 的 通 
信 、 发 回 运算 结果 。 大 多 数 的 BOINC 科学 应 用 程序 都 提供 了 一 套 屏幕 保护 程序 图 形 显示 ， 
通过 图 形 、 图 表 和 动画 来 展示 正在 完成 的 工作 。 目 前 ，BOINC 支持 的 项 目 包 括 一 些 粒子 物 
理 实验 、 气 候 预 测 、 蛋 白质 结构 、 流 行 病 学 和 医疗 疾病 项 目 、 癌 症 研 究 以 及 外 星 文明 探寻 之 
家 (SETIQ@Home)。2008 年 年 初 ，BOINC 在 全 球 已 拥有 超过 250 万 台 活 跃 的 计算 机 ， 提 供 
了 超过 800 TFLOPS ( Trillion FLoating-point Operations Per Second， 每 秒 万 亿 次 浮 点 运算 操 
作 ) 的 计算 能 力 。 当 然 ， 这 些 数据 还 将 继续 向 上 攀升 。 

Condor 

Condor 系统 采用 了 一 种 不 同 的 方法 ， 甚 允许 管理 人 员 创 建 由 空闲 工作 站 组 成 的 本 地 集 
群 来 实施 分 布 式 处 理 ， 且 没有 集群 的 限制 或 约束 ， 也 无 须 不 辞 辛劳 地 去 构建 集群 设置 硬件 和 
软件 或 者 组 织 网 格 。 它 提供 了 一 套 类 似 于 BOINC 的 基础 设施 ， 但 是 每 个 项 目 管理 其 自己 的 
单一 项 目 以 及 一 个 专 有 节点 集 ， 且 相关 节点 只 可 能 由 单一 机 构 所 拥有 。 

Condor 是 威斯康星 大 学 正在 进行 的 项 目 ， 其 允许 用 户 将 其 计算 机 注册 为 可 用 的 ， 并 对 
相应 计算 机 的 性 能 加 以 描述 : 拥有 什么 类 型 的 处 理 器 (Pentium、PowerPC、Athlon 等 )、 多 
大 的 内 存 空 间 和 磁盘 空间 、 安 装 有 什么 软件 库 ， 等 等 。 同 时 ， 想 要 运行 一 个 程序 或 一 组 程序 
(工作 流 ) 的 人 应 当 以 类 似 的 方式 对 有 关 程 序 的 要 求 加 以 描述 。 这 些 描述 被 称 为 ClassAds (类 
似 于 分 类 广告 一 样 的 描述 )， 并 由 Condor 用 来 进行 匹配 撮合 ( 即 寻求 提供 者 和 请 求 者 之 间 的 
最 佳 匹配 ) 。Condor 允许 计算 机 就 什么 时 候 完 成 有 关 工 作 进行 偏好 描述 。 例 如 ， 某 台 系 统 可 
能 允许 利用 后 台 或 者 在 无 人 操作 键盘 的 几 分 钟 内 ， 运 行 相关 任务 。 经 过 多 年 的 发 展 ，Condor 
已 经 变 得 非常 流行 和 普及 ,已 经 成 为 一 个 非常 稳定 的 系统 ， 且 相关 操作 要 求 也 只 是 安装 一 个 
简单 程序 到 希望 提供 服务 的 计算 机 上 就 可 以 了 。 

常见 问题 

志愿 计算 系统 必须 能 够 就 所 使 用 的 计算 机 的 如 下 几 方 面 的 问题 加 以 妥善 处 理 : 
它们 是 异 构 的 ， 因 此 有 关 软 件 应 当 能 够 很 快 地 适应 异 构 配置 。 
它们 加 入 和 离开 系统 的 时 机 不 可 预测 。 
它们 的 可 用 性 是 不 规律 的 。 

e 它们 的 正常 的 系统 使 用 不 应 受到 志愿 计算 系统 的 干扰 。 

此 外 ， 志 愿 计 算 系 统 必 须 处 理 一 些 关 于 结果 可 靠 性 的 问题 ， 这 是 因为 志愿 者 常常 是 匿名 
的 ， 故 而 是 不 负 有 责任 的 : 

e。 某 些 志愿 计算 机 可 能 会 出 现 故 障 并 返回 不 正确 的 结果 。 

e 为 了 获得 额外 的 信用 ， 志 愿 计算 机 的 速度 可 能 会 设置 得 太 快 ， 所 以 会 更 频繁 地 发 生 

故障 。 

e 志愿 计算 机 可 能 会 故意 返回 不 正确 的 结果 。 

e 志愿 计算 机 可 能 为 结果 提出 过 分 的 信用 要 求 。 

关于 所 有 这 些 问 题 的 一 种 通用 的 解决 方法 是 ， 让 每 批 数据 在 至 少 两 台 计 算 机 上 进行 处 
理 。 有 关 结 果 和 信用 只 有 在 它们 非常 接近 的 情况 下 才 会 被 接受 或 认可 。 所 采用 的 另 一 项 技术 
是 对 有 关 结 果 进 行 校 验 和 计算 或 者 执行 循环 元 余 校 验 ( Cyclic Redundancy Check，CRC, 或 
称 为 循环 元 余 校 验 码 )。 这 些 是 针对 有 关 结 果 数 据 进行 计算 的 数学 函数 ， 常 常用 来 检测 传输 
错误 或 算 改 问题 。 
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7.5 ”操作 系统 相关 概念 在 对 称 多 人 处理、 集群 和 网 格 中 的 解读 


在 这 一 节 ， 我们 将 讨论 一 些 曾 经 在 前 面 章节 中 有 过 描述 的 操作 系统 概念 ， 并 分 析 它 们 
与 那里 讨论 的 单 处 理 器 系统 相关 概念 的 区 别 。 在 某 些 情况 下 ， 并 行 系 统 中 的 有 关 概 念 和 实现 
几乎 与 单 处 理 器 系统 一 模 一 样 ; 但 在 少数 情况 下 ， 某 些 差 异 则 比较 重要 、 较 为 显著 和 值得 
注意 。 

7.5.1 进程 同步 和 通信 

请 回想 一 下 ， 进 程 常 常 与 其 他 进程 分 工 协作 ， 而 这 通常 也 意味 着 对 数据 的 共享 。 这 样 
的 任务 分 配 以 及 数据 的 分 解 或 共享 往往 需要 进程 之 间 的 协调 〈 译 者 注 : 即 进程 同步 和 通信 )。 
即使 是 在 相关 可 执行 元 素 之 间 没 有 很 多 交互 的 简单 情况 下 ， 也 需要 对 那些 可 能 运行 在 不 同 
系统 上 的 进程 之 间 的 有 关 共 享 数据 (即使 仅仅 一 个 数字 ) 的 小 部 分 的 程序 代码 保持 必要 的 
小 心 谨慎 。 进 一 步 说 ,我 们 应 努力 避免 因 两 个 进程 试图 同时 更 改 单个 数据 项 称 为 竞 态 
条 件 (race condition) 而 引发 问题 。 传 统 上 ， 进 程 间 通信 一 般 采 用 共享 存储 器 (shared 
memory， 或 称 为 共享 内 存 ) 或 消息 队列 来 加 以 实现 。 而 关于 数据 并 发 访问 的 同步 问题 则 通 
过 在 相关 进程 的 实际 操作 数据 的 所 谓 临界 区 ( critical section) 中 采用 信号 量 或 类 似 的 锁定 机 
制 来 加 以 解决 。 以 上 这 些 机 制 往往 建立 在 共享 内 存 和 特殊 的 处 理 器 指令 的 基础 之 上 ， 有 具体 将 
在 第 9 章 中 详细 阐述 。 对 于 一 些 分 布 式 体系 结构 而 言 ， 并 没有 提供 这 些 机 制 ， 所 以 必须 得 使 
用 其 他 的 机 制 。 关 于 相关 系统 是 如 何在 分 布 式 体系 结构 中 实现 同步 和 通信 的 问题 ， 或 许 通过 
一 个 简单 的 例子 最 能 够 说 明白 和 解释 清楚 。 


天 2 = 个 例子 


设想 我 们 拥有 一 个 很 长 的 关于 许多 人 的 信息 列表 。 例 如 ， 其 中 可 能 包括 电话 号 码 、 姓 
和 名、 电子 邮件 地 址 和 诸如 去 年 的 家 庭 收入 等 一 些 数值 。 我 们 希望 按 电话 号 码 升 序 方式 对 有 关 
信息 列表 进行 排序 ， 同 时 计算 平均 收入 。 这 是 针对 本 章 中 所 讨论 的 体系 结构 的 一 个 非常 理想 
的 问题 。( 事 实 上 ， 这 个 问题 可 能 有 点 过 于 理想 ， 因 为 它 可 以 被 结构 化 为 高 度 并 行 的 应 用 程 
序 ， 并 因而 产生 一 个 对 于 分 布 式 计算 可 能 不 太 典 型 的 加 速 因 子 )。 

解决 这 个 问题 的 最 显而易见 的 方法 就 是 将 有 关 列 表 分 解 成 更 小 的 、 单 独 的 列表 。 进 一 步 
说 ， 如 果 我 们 拥有 8 个 处 理 器 来 共同 分 担 这 项 工作 ， 那 么 我 们 就 可 以 先 让 每 个 处 理 器 针对 八 
分 之 一 的 数据 进行 排序 并 计算 相应 的 平均 值 ， 然 后 我 们 再 对 相关 结果 进行 合并 处 理 。 各 八 分 
之 一 数据 的 处 理 过 程 就 是 前 面 曾 有 过 描述 的 一 种 横扫 流 ， 而 最 后 的 合并 步 又 是 管道 流 ， 同 样 
是 管道 流 的 还 有 在 有 关 工 作 流 程 的 开始 的 时 候 针 对 数据 的 划分 操作 。 在 每 个 处 理 器 对 其 自己 
的 列表 部 分 进行 排序 和 计算 均值 的 时 候 ， 在 进程 之 间 并 没有 交互 。 不 过 ， 在 合并 结果 列表 和 
计算 整体 均值 的 时 候 ， 会 有 数据 共享 。 

如 果 我 们 可 以 在 所 有 结果 计算 完成 之 前 开始 处 理 (合并 ) 相关 结果 ， 那 么 将 会 更 加 高 效 。 
但 是 这 却 可 能 产生 竞 态 条 件 ， 也 就 是 说 ,一 些 处 理 器 在 所 有 处 理 器 产生 它们 的 第 一 批 输出 之 
前 就 开始 尝试 合并 结果 。 进 一 步 说 ， 即 使 所 有 8 个 处 理 器 是 相同 的 类 型 和 速度 ， 但 关于 它们 
在 同一 时 间 完 成 它们 工作 任务 的 情况 也 将 是 非常 不 寻常 的 。 是 的 ， 我 们 可 以 通过 把 更 多 的 工 
作 一 一 列表 中 的 更 多 的 数据 一 一 交 给 更 快 的 处 理 需 来 加 以 平衡 。 例 如 ， 如 果 一 个 处 理 器 的 运 
算 速度 是 其 他 处 理 器 运算 速度 的 两 倍 ， 我 们 可 以 给 它 两 倍 的 数据 来 进行 处 理 。 但 是 ， 鉴 于 排 
序 的 时 间 复 杂 度 并 非 线 性 时 间 函 数 ， 所 以 对 两 们 数据 列表 进行 排序 所 用 时 间 将 会 比 对 单 倍数 
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据 列 表 排 序 所 用 时 间 的 两 倍 还 要 长 ， 因 此 ， 这 种 方案 并 不 会 奏效 。 总 的 来 说 ， 预 测 并 行进 程 
的 运行 时 间 非 常 重要 ， 但 通常 情况 下 非常 困难 ， 而 且 不 会 非常 精确 。 


7.5.3 ”例子 复杂 化 的 一 面 


现在 ， 我 们 的 简单 示例 已 经 变 得 比较 复杂 了 一 一 在 各 数据 子 列表 排序 结果 产生 的 时 候 ， 
对 相关 排序 结果 进行 合并 ， 同 时 计算 相应 数据 的 平均 值 (一 些 加 法 ， 可 能 结合 乘法 ， 还 有 除 
法 ) 一 一 并 且 ， 在 我 们 可 以 使 用 一 个 横扫 流 进程 的 结果 之 前 ， 我 们 需要 知道 它 是 否 已 经 完成 。 
在 单 处 理 器 计算 机 上 ， 这 没有 什么 困难 。 我 们 可 以 利用 共享 内 存 来 进行 通信 ， 并 通过 设置 有 
关 数 据 中 的 标志 来 指示 完成 ， 从 而 实现 完成 信号 的 发 送 和 告知 。 


7.5.4 ”对 称 多 处 理 的 解决 方案 


这 在 对 称 多 处 理 系统 上 是 如 何 做 到 的 呢 ? 幸运 的 是 ， 可 以 采用 与 在 单 处 理 器 计算 机 上 完 
全 相同 的 方法 来 实现 。 因 为 ， 对 称 多 处 理 架构 在 所 有 处 理 器 之 间 共 享 内 存 ， 所 以 对 于 大 部 分 
用 来 在 进程 间 通 信 的 常用 技术 来 说 ， 可 以 采取 和 单 处 理 器 系统 一 样 的 处 理 方式 。 我 们 将 会 在 
第 9 章 进一步 讨论 对 称 多 处 理 操 作 系 统 中 所 涉及 的 相关 问题 。 


7.5.5 ”集群 的 解决 方案 


如 何在 计算 机 集群 上 进行 共享 和 锁定 呢 ? 与 单 处 理 器 系统 或 对 称 多 处 理 系 统 相 比 ， 这 
种 体系 结构 较为 困难 。 共 享 内 存 是 不 可 能 的 (可 以 进行 模拟 , 但 是 速度 相当 慢 )。 而 消息 必 
须 通 过 局 域 网 在 各 处 理 器 节点 之 间 传 送 。 相 关 工 作 进 行 了 划分 和 分 发 。 但 由 于 数据 不 是 在 处 
理 器 之 间 的 内 存 中 共享 的 ， 所 以 必须 把 它们 分 别 发 送 给 每 个 处 理 器 节点 。 如 果 有 关 数 据 是 源 
自 于 文件 ， 那 么 可 能 存在 跨 节点 的 文件 共享 ， 可 以 在 一 定 程度 上 最 小 化 这 种 分 布 处 理 机 制 的 
影响 。 

鉴于 集群 中 系统 之 间 的 通信 要 比 对 称 多 处 理 系统 中 的 系统 之 间 的 通信 缓慢 许多 ， 所 以 
通常 情况 下 ， 对 于 尝试 对 相关 问题 处 理 进行 划分 以 放 到 集群 架构 上 运行 的 方案 而 言 ， 一 般 尽 
量 确保 在 各 个 进程 结束 之 前 基本 不 要 有 进程 之 间 的 交互 。 正 因 如 此 ， 比 起 对 称 多 处 理 系统 或 
单 处 理 器 系统 来 ， 面 向 集群 的 工作 流程 的 重 写 和 重组 需要 更 多 的 编程 和 设计 工作 ， 并 且 到 最 
后 ,可 以 并 行 处 理 的 工作 不 见得 会 有 多 少 。 不 过 ， 集 群 的 可 取 之 处 在 于 集群 中 的 每 个 处 理 节 
点 的 成 本 要 低 得 多 。 


7.5.6 ”网 格 的 解决 方案 


对 于 网 格 架 构 的 系统 来 说 ， 又 如 何 来 实现 锁定 和 共享 呢 ? 这 是 最 为 困难 的 情况 。 在 网 格 
中 的 集群 之 间 共 享 内 存 ， 从 技术 上 讲 就 是 不 可 能 的 ， 而 且 非 常 难以 模拟 。 消 息 必 须 通 过 可 能 
受到 防火 墙 保护 的 网 络 而 在 节点 之 间或 集群 之 间 进行 传送 。 有 关节 点 可 能 相距 其 远 ， 故 而 具 
有 非常 高 的 通信 延迟 。 同 样 ， 相 关 工 作 进 行 了 划分 和 分 发 。 但 由 于 数据 不 是 在 处 理 器 之 间 的 
内 存 中 共享 的 ， 所 以 必须 通过 网 络 一 一 主要 是 互联 网 ， 常 常 比较 慢 ， 不 过 也 可 能 是 第 二 代 互 
联网 ， 传 送 速度 通常 会 稍 好 一 些 一 一 把 它们 分 别 发 送 给 每 个 集群 。 类 似 地 ， 相 应 结果 必须 经 
由 同样 的 网 络 传 回来 。 即 使 有 关 数 据 是 存储 在 文件 中 ， 被 共享 的 文件 仍然 必须 得 复制 到 男 一 
个 集群 ， 从 而 实现 对 应 数据 在 该 集群 的 节点 之 间 的 共享 。 

既然 如 此 麻烦 费力 ， 为 什么 这 样 的 努力 还 是 值得 做 的 呢 ? 为 什么 我 们 要 使 用 网 格 来 进行 
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计算 ? 我 们 使 用 网 格 ， 理 由 在 于 网 格 也 是 共享 技术 ， 不 过 不 是 单纯 地 共享 内 存 ， 而 是 在 用 户 
之 间 共 享 整 个 计算 机 集群 。 进 一 步 说 ， 一 个 研究 人 员 甚 至 可 以 使 用 50 个 计算 机 集群 ， 而 每 
个 集群 可 能 拥有 10 一 400 个 左右 的 节点 ， 而 不 再 仅仅 限于 只 能 使 用 本 地 集群 中 的 几 百 个 左 
右 的 节点 。 这 种 高 级 别 的 共享 可 以 允许 在 一 段 较 短 的 时 间 里 使 用 成 千 上 万 个 节点 。 鉴 于 一 个 
人 是 在 使 用 别人 的 集群 ， 所 以 使 用 时 间 不 可 能 太 长 ， 也 许 只 有 几 千 个 小 时 。 但 是 ， 这 个 人 也 
应 当 把 自己 的 本 地 集群 分 享 出 去 ， 所 以 事情 从 长 远 来 看 还 是 基本 平衡 的 ， 即 收 支 相抵 的 。 于 
是 ， 网 格 的 用 户 便 由 此 形成 了 虚拟 组 织 ( virtual organization)。 这 些 组 织 各 成 员 一 致 同意 聚 
集 和 共享 资源 (如 他 们 的 集群 )。 此 类 组 织 是 不 断 动态 变化 的 。 例 如 ， 为 了 计算 分 析 一 个 问 
题 ， 便 可 能 会 形成 一 个 相应 的 虚拟 组 织 。 这 个 问题 可 能 是 一 个 诸如 生物 信息 学 的 任务 ， 整 个 
工作 流程 总 共 需 要 100 000 个 计算 小 时 ， 但 是 通过 组 织 24 个 集群 创建 一 个 小 网 格 来 实施 计 
算 ， 到 周末 即 可 完成 。 其 后 ， 该 虚拟 组 织 便 可 解散 ， 直 到 遇 到 下 一 个 大 问题 再 重建 新 的 虚拟 
组 织 。 相 比 之 下 ， 如 果 是 在 和 该 集群 的 节点 相 类 似 的 单 台 计 算 机 上 来 解决 这 一 问题 ， 可 能 得 
需要 10 年 以 上 的 运行 时 间 ; 即便 是 利用 如 本 章 后 面 所 描述 的 那样 的 典型 的 本 地 集群 来 加 以 
处 理 ， 也 需要 半年 的 时 间 。 

对 于 非常 大 的 数据 集 ， 例 如 大 型 强 子 对 撞 机 (Large Hadron Collider，LHC ; 是 欧洲 粒 
子 物理 研究 所 的 的 大 粒子 加 速 器 ; CERN 是 欧洲 粒子 物理 研究 所 的 前 身 ， 即 欧洲 核子 研究 理 
事 会 的 法 语 名 称 Conseil Européen pour la Recherche Nuclkaire 的 首 字母 缩写 ) 的 物理 实验 的 
输出， 相关 分 析 工作 将 会 耗费 数 百 万 的 计算 小 时 ， 因 此 相应 的 虚拟 组 织 将 会 存在 相当 长 的 一 
段 时 间 。 这 些 组 织 与 摩尔 定律 之 间 存 在 一 定 的 依赖 关系 。 摩 尔 定律 指出 ， 计 算 机 及 其 计算 能 
力 将 会 逐年 增加 ， 故 而 在 以 后 的 岁月 里 ， 有 关 处 理 进 度 将 会 加 快 ， 这 样 研 究 人 员 便 可 能 会 发 
现 新 的 科学 原理 ， 否 则 将 永远 不 会 找到 。 


7.5.7 文件 共享 技术 


通常 情况 下 ， 大 规模 计算 的 用 户 往 往 会 用 到 大 量 的 文件 。 相 关 文 件 包含 有 原始 数据 取 
值 、 参 数 、 中 间 结 果 、 最 终结 果 以 及 其 他 信息 。 其 中 某 些 文件 非常 庞大 的 情况 并 不 少见 ， 有 
的 文件 甚至 可 能 达到 好 几 十 亿 字 节 ( GB)。 对 于 集群 而 言 ， 拥 有 好 几 万 亿 字 节 (TB) 的 存储 
器 (在 某 些 情况 下 ， 容 量 可 达到 一 百 万 亿 字 节 ) 颇 为 常见 ， 而 前 面 提 到 的 大 型 强 子 对 撞 机 则 
需要 千 万 亿 字 节 (PB) 级 别 的 存储 器 。 

对 称 多 处 理 架 构 的 文件 共享 相对 要 容易 一 些 ， 因 为 有 关 进 程 也 共享 文件 系统 。 当 然 ， 共 
享 文件 的 相关 进程 可 能 需要 利用 锁 或 类 似 机 制 来 进行 协调 。 在 大 多 数 的 对 称 多 处 理 架 构 中 ， 
存在 一 个 (或 一 些 ) 由 操作 系统 管理 的 主 文件 系统 。 鉴 于 有 关 操 作 系 统 负 责 处 理 文件 操作 ， 
所 以 它 可 以 在 创建 、 读 取 、 写 人 和 执行 其 他 文件 操作 的 多 个 进程 之 间 进 行 协调 。 

在 集群 中 ， 相 同 操作 系统 的 多 个 实例 运行 在 不 同 的 处 理 器 上 ， 并 负责 管理 文件 的 共享 。 
这 具体 可 以 通过 创建 特殊 的 文件 共享 节点 来 加 以 实现 ， 换 句 话 说 ,文件 共享 节点 允许 它们 控 
制 的 文件 由 对 应 集群 中 的 任何 一 个 (或 多 个 ) 节点 进行 操作 访问 。 进 一 步 说 ， 文 件 共享 节点 
所 支持 的 接口 提供 了 与 由 单个 节点 或 对 称 多 处 理 系 统 中 的 本 地 操作 系统 基本 相同 的 功能 。 鉴 
于 对 集群 中 的 文件 的 访问 操作 也 可 能 出 现 竞 态 条 件 问 题 ， 所 以 文件 共享 节点 常常 还 提供 了 锁 
定 命令 来 锁定 文件 的 全 部 或 一 部 分 ， 从 而 实现 无 错误 的 数据 共享 。 

网 格 不 会 共享 文件 的 某 部 分 ， 也 不 允许 在 集群 之 间 锁 定 。 但 网 格 允许 复制 整个 文件 ， 并 
且 某 些 网 格 工具 可 以 模拟 类 似 于 集群 那样 的 文件 共享 。 确 保 多 个 集群 中 的 所 有 节点 拥有 每 个 
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共享 文件 的 一 臻 的、 相同 的 视图 是 非常 具有 挑战 性 的 ， 故 而 也 是 网 格 研 究 的 活跃 领域 。 在 集 
群 之 间 几 乎 相同 的 文件 的 管理 甚至 要 更 为 困难 ， 虽 然 有 关 文件 发 生 了 一 点 改变 ， 但 它们 仍然 
有 具有 相同 的 文件 名 。 


7.5.8 远程 服务 的 运用 


应 用 程序 经 常 需要 访问 远程 服务 。 这 些 远程 服务 可 能 包括 远程 子 程序 、 远 程 函数 、 对 象 
上 的 方法 或 单独 的 进程 。 在 并 行 和 分 布 式 计算 领域 ， 远 程 服务 的 主题 已 经 流行 了 好 几 十 年 了 。 
相关 主题 涵盖 远程 服务 如 何 启动 、 如 何 远程 调用 有 关 服 务 、 如 何 传递 参数 以 及 如 何 返回 结果 
等 方面 。 

在 对 称 多 处 理 系统 上 ， 特 定 进程 之 外 的 服务 在 大 多 数 情况 下 通过 远程 过 程 调用 (Remote 
Procedure Call，RPC) 或 远程 方法 调用 (Remote Method Invocations，RMI) 来 进行 调用 。 
这 与 前 面 针对 进程 间 管 理 所 讨论 的 是 相同 的 机 制 。 在 集群 上 运行 的 系统 采用 中 间 件 对 远程 过 
程 调用 或 远程 方法 调用 进行 了 增强 ， 以 使 相关 调用 与 对 称 多 处 理 系统 或 支持 多 道 处 理 的 单 处 
理 器 系统 上 的 相同 调用 保持 一 致 。 由 于 共享 (特别 是 共享 数据 ) 所 遭遇 的 困难 以 及 安全 的 问 
题 ， 所 以 网 格 系统 面临 巨大 的 挑战 。 理 所 当然 地 ， 大 多 数 的 集群 管理 员 对 支持 与 对 应 集群 中 
他 们 允许 远程 访问 的 节点 的 直接 联系 非常 警惕 。 另 外 ， 网 格 系统 具有 潜在 的 较 长 的 网 络 延 
迟 ， 所 以 网 格 服务 往往 由 批量 类 型 的 非 交 互 式 服务 器 进行 提供 。 新 的 网 格 服务 模型 ， 例 如 第 
7.4.4 节 中 所 讨论 的 新 的 Globus 模型 ， 就 提供 了 万 维 网 服务 作为 模型 ， 并 通过 颁发 证 书 (“入 
网 券 ”) 来 提供 安全 性 。 

远程 服务 器 和 远程 服务 历史 悠久 ， 各 种 观点 层出不穷 ， 多 种 实现 方式 各 有 千秋 ， 在 接 下 
来 的 许多 年 里 ， 这 一 领域 仍 将 充满 争论 ， 并 继续 保持 重要 地 位 。 


7.5.9 故障 处 理 


最 后 ， 我 们 要 谈论 的 是 一 个 不 那么 令 人 愉快 的 问题 ， 也 就 是 说 ， 当 系统 出 错时 会 发 生 
什么 ? 

因为 更 多 的 组 件 、 更 多 的 计算 机 以 及 更 多 的 软件 被 聚合 成 一 个 更 大 的 系统 ， 所 以 系统 出 
错 的 几率 将 大 大 增加 ， 哪 怕 可 能 只 是 一 些小 的 问题 。 这 就 是 为 什么 对 称 多 处 理 系统 、 集 群 和 
网 格 必须 全 部 识别 和 处 理 偶发 故障 的 原因 所 在 。 

什么 可 能 发 生 故 障 呢 ? 首先 可 以 想到 的 就 是 硬件 故障 一 一 磁盘 坏 了 ， 可 能 是 芯片 烧 了 ， 
于 是 计算 机 停止 工作 。 这 将 会 导致 一 个 节点 失败 或 不 再 响应 ， 并 丢失 其 正在 进行 的 工作 ( 结 
果 )。 网 络 故 障 发 生 的 概率 比 节 点 故障 还 要 高 。 可 能 是 电缆 松动 ， 也 可 能 是 交换 机 或 路 由 器 
因 发 生 故 障 而 失败 。 当 然 ， 网 络 或 服务 器 也 可 能 遭受 拒绝 服务 ( Denial of Service ，DoS ) 攻 
击 。( 我 们 在 第 16 章 将 会 讨论 此 类 攻击 。) 更 为 常见 的 是 一 个 网 络 或 路 由 器 会 变 得 超载 和 非 
常 拥堵 ， 故 而 会 丢弃 某 些 数 据 流 。 一 般 来 说 ， 网 络 故障 往往 会 效仿 节点 故障 。 

但 是 软件 也 可 能 会 导致 故障 。 例 如 ， 可 能 是 把 错误 版 本 的 程序 或 错误 版 本 的 运行 时 库 加 
载 到 了 系统 上 。 这 是 一 种 十 分 常见 的 问题 。 不 幸 的 是 ， 由 软件 缺陷 所 导致 的 故障 ， 往 往 直 到 
故障 实际 发 生 很 久之 后 才能 被 检测 到 。 

为 此 ， 在 软件 编写 的 时 候 就 必须 要 考虑 故障 的 发 生 与 解决 。 例 如 ， 中 间 件 可 以 使 用 超时 
来 检查 确认 一 个 远程 过 程 调用 或 其 他 的 服务 器 请 求 在 合理 的 时 间 期 限 内 得 到 了 响应 。 并 且 ， 
如 果 相 应 的 服务 在 对 应 时 间 期 限 内 没有 得 到 响应 ， 那 么 应 当 执行 另 一 次 调用 ， 且 有 可 能 是 针 
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对 男 一 不 同 的 服务 器 的 。 而 如 果 针 对 原先 请 求 的 响应 后 来 又 出 现 了 ， 那 么 只 是 把 有 关 结 果 丢 
弃 掉 就 可 以 了 。 

监控 系统 可 以 观察 网 络 流量 ， 并 尝试 检测 故障 ， 同 时 还 可 以 查看 单个 节点 或 集群 的 性 
能 以 检测 因为 硬件 或 配置 不 当 的 软件 而 导致 的 故障 。 需 要 指出 的 是 ， 这 里 牵涉 权衡 取舍 的 问 
题 。 例 如 ， 太 少 的 监控 将 会 导致 故障 很 长 时 间 不 被 注意 和 未 予 处 理 ， 但 是 ， 太 多 的 监控 则 会 
给 计算 资源 和 网 络 带宽 带 来 巨大 的 开销 。 


7.6 ”举例 说 明 
7.6.1 在 集群 和 网 格 上 的 科学 计算 


在 过 去 的 几 年 中 ,若干 具有 重要 意义 的 、 计 算 密集 型 的 自然 科学 项 目 已 经 使 用 了 大 型 
的 计算 集群 和 计算 网 格 。 在 这 一 节 ， 我们 将 讨论 一 些 这 样 的 项 目 。 伴 随 普通 商品 计算 机 、 磁 
盘存 储 系统 、 高 速 网 络 设备 、 网 络 带宽 以 及 控制 工作 任务 和 数据 分 配 的 软件 的 价格 的 不 断 下 
降 ， 此 类 系统 的 费用 最 近 已 经 达到 了 大 多 数 研究 团体 可 以 承受 的 程度 。 因 此 ,许多 新 项 目 在 
过 去 的 一 年 才 取 得 了 成 果 ， 同 时 还 有 其 他 的 一 些 项 目 至 今 尚未 达到 这 样 的 里 程 碑 阶段 。 下 面 
的 这 些 项 目 并 非 是 最 大 的 ， 也 可 能 不 是 最 具 重 大 意义 的 ， 然而， 它们 是 运用 不 同方 法 和 技术 
完成 计算 密集 型 工作 任务 的 具有 代表 性 的 例子 。 


7.6.2 人 类 基因 组 脱氧 核糖 核酸 组 装 


在 20 世纪 90 年 代 初 ，J. Craig Venter 建议 对 大 型 基因 组 采用 全 基因 组 鸟 枪 组 装 法 。( 利 
用 目前 的 技术 不 可 能 在 非常 长 的 脱氧 核糖 核酸 ( Deoxyribo Nucleic Acid，DNA) 片段 中 按 每 
次 一 个 的 方式 来 简单 地 读 取 每 个 核 苷 酸 (nucleotide)。 对 于 基因 组 组 装 来 说 ， 首 先 得 把 脱氧 
核糖 核酸 链 撕 成 许多 短小 的 片段 ， 然 后 再 通过 测序 机 器 以 每 次 高 达 900 个 碱 基 的 串 的 方式 来 
“ 读 取 ”这 些 片 段 。 其 中 ， 碱 基 分 为 腺 味 叭 (adenine)、 鸟 味 叭 (guanine)、 胞 喀 啶 (cytosine) 
和 胸腺 喀 啶 (thymine) 共 4 种 ,通常 表示 为 A、G、C 和 T。 基 因 组 组 装 算法 通过 提取 所 有 
片段 并 将 它们 彼此 对 齐 ， 然 后 检测 两 个 短 串 重 琶 的 所 有 位 置 。 有 关 示 例如 图 7-5 所 示 ， 其 中 
可 以 看 到 关于 原始 碱 基 串 的 短片 段 的 几 种 重 至 情况。 有 关 方 法 已 经 变 得 非常 流行 ， 这 在 很 大 
程度 上 是 因为 有 了 计算 机 集群 并 可 将 之 用 于 组 装 大 量 的 重 垒 片段。 虽然 较 小 的 基因 组 已 经 被 
文 特 尔 使 用 鸟 枪 组 装 法 完成 了 测序 ， 但 是 组 装 人 类 基因 组 需要 更 强大 的 计算 资源 和 非常 复杂 
的 软件 。 进 一 步 说 ， 有 关 方 法 所 扫描 的 人 类 基因 组 的 碱 基 对 的 数量 要 上 略 多 于 30 亿 ， 且 已 经 
被 分 解 成 超过 5000 万 个 重 芭 片段 。 由 于 分 解 和 读 取 序列 的 化 学 过 程 不 太 完 美 ， 所 以 有 关 算 
法 着 眼 于 在 对 齐 两 端 后 查找 近似 匹配 。 


原始 碱 基 串 XXXACGATCGTCGAGTCATCGTTAGCGTAXXXX 
第 一 个 样本 -A XXXACGATCGTCGAGTCATCGTXXXXXXXXXXX 
第 一 个 样本 -B XXXXXXXXXXXXXXXXXXXXXXTAGCGTAXXXX 
第 二 个 样本 -A XXXACGATGXXXXXXXXXXXXXXXXXXXXXXXX 
第 二 个 样本 -B XXXXXXXXXCTCGAGTCATCGTTAGCGTAXXXX 
图 7-5 基因 组 组 装 
这 项 工作 在 人 类 基因 组 组 装 方面 所 完成 的 处 理 最 初 需要 大 约 20 000 个 处 理 器 小 时 。 但 
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是 采用 了 由 40 台 四 处 理 器 对 称 多 处 理 系统 所 组 成 的 集群 之 后 ， 仅 仅 几 天 时 间 便 做 完了 。 这 
个 系统 当时 花费 了 4000 万 美元 ， 现 在 对 于 同等 处 理 能 力 的 系统 来 说 ， 也 就 花费 几 十 万 美元 。 

公共 人 类 基因 组 计划 ( Human Genome Project) 所 使 用 的 主要 替代 方法 是 组 装 更 长 的 序 
列 ， 即 由 有 关 片 段 生成 更 长 的 已 知 序 列 。 这 种 分 级 方法 也 需要 大 量 的 计算 资源 。 为 此 ， 定 
制 设计 和 开发 编写 了 一 个 称 为 GigAssembler 的 程序 ， 并 让 其 运行 在 一 个 由 100 个 节点 所 组 
成 的 Linux 集群 上 。 以 上 这 两 种 方法 ， 计 算 需 求 足 够 大 到 要 求 使 用 计算 集群 。 在 这 样 的 情况 
下 ， 真 的 没有 其 他 合理 的 选择 方案 。 


7.6.3 IBM 计算 生物 学 中 心 和 集群 计算 


多 年 来 ，IBM 一 直 积极 参 与 并 行 和 分 布 式 计算 ， 在 开发 超大 规模 计算 机 集群 和 软件 基 
础 设施 以 及 使 用 相关 系统 的 生物 学 应 用 程序 等 方面 处 于 领先 地 位 ， 并 发 挥 了 领导 作用 。Blue 
Gene/L ( 蓝 色 基 因 左 ) 是 一 个 由 131 000 个 处 理 器 组 成 的 集群 ， 并 且 具 有 到 达 每 个 节点 的 多 
条 网 络 通路 。 该 系统 由 Lawrence Livermore Labs( 劳 伦 斯 利 弗 莫 尔 实验 室 ) 与 IBM 共同 设计 ， 
主要 用 于 科学 研究 。 需 要 说 明 的 是 ， 在 全 世界 最 大 的 500 个 计算 集群 中 ,大 约 一 半 是 IBM 
的 计算 机 。 蓝 色 基 因 系 列 的 计算 机 ， 所 有 特大 型 的 集群 ， 均 使 用 相对 中 等 速度 的 处 理 器 ， 并 
采用 Linux 的 修改 版 本 作为 操作 系统 。 

计算 生物 学 中 心 (Computational Biology Center) 拥有 若干 令 人 感 兴 趣 的 大 型 项 目 ， 包 
括 生物 信息 学 、 医 学 信息 学 和 功能 基因 组 学 研究 。 其 中 一 个 项 目 ， 即 所 谓 Blue Matter ( 蓝 色 
物质 ) 的 生物 分 子 模拟 器 ， 用 来 模拟 较 长 时 间 尺 度 下 ( 几 百 纳 秒 到 几 微 秒 ) 的 中 等 大 小 的 系 
统 ( 10 000 一 100 000 个 原子 )。 对 于 一 微 秒 的 模拟 时 间 ， 一 个 包含 43 000 个 原子 的 膜 蛋 白 
系统 利用 蓝 色 基因 代 上 的 4096 个 处 理 器 来 运行 ， 所 需 的 挂钟 时 间 略 小 于 两 个 月 。 


7.6.4 志愿 计算 集群 


多 年 以 来 ， 利 用 那些 不 用 就 可 能 被 浪费 掉 的 处 理 器 周期 的 目标 已 经 吸引 了 许多 人 。 
SETI@home (外 星 文 明 探寻 之 家 ) 是 一 个 搜寻 外 星人 的 项 目 ， 其 利用 了 从 射电 望远镜 收集 的 
多 年 数据 ， 相 关 数 据 一 直 存 储 在 库 中 ,， 但 苦于 没有 可 用 的 计算 资源 能 够 对 其 进行 分 析 。 从 计 
算 的 角度 来 看 ,“ 外 星 文明 探寻 之 家 ”项 目 已 经 取得 了 引 人 注 目的 巨大 成 功 。 多 年 来 超过 500 
万 的 参与 者 贡献 了 超过 200 万 年 的 总 的 计算 时 间 。 在 2008 年 年 初 ， 有 人 估算 认为 ， 在 任何 给 
定时 间 ,“ 外 星 文明 探寻 之 家 ”项 目 系 统 中 的 所 有 计算 机 总 共 可 提供 每 秒 370 万 亿 次 浮 点 运算 
操作 〈 即 每 秒 370X 102 次 浮 点 运算 操作 ) 的 计算 能 力 。 作 为 对 比 ， 蓝 色 基 因 代 计算 集群 可 以 
达到 每 秒 478.2 万 亿 次 浮 点 运算 操作 的 峰值 性 能 ， 且 其 处 理 器 数量 约 为 “外 星 文明 探寻 之 家 ” 
项 目 系统 处 理 器 数量 的 六 分 之 一 。 但 请 注意 ,“ 外 星 文明 探寻 之 家 ”项 目的 计算 机 是 通过 家 
庭 网 络 和 电话 线 进 行 连接 的 ， 其 中 混杂 着 各 种 各 样 的 机 器 ， 既 有 比较 新 的 ， 也 有 上 比较 旧 的 ， 
有 时 还 在 为 它们 的 用 户 做 着 其 他 实际 的 工作 。 虽 然 尚未 发 现 确 茧 的 外 星人 的 迹象 ， 但 已 经 有 
了 一 些 值得 关注 的 发 现 ， 并 对 进一步 的 研究 提供 了 正当 理由 。 在 最 近 出 版 的 天 文学 刊物 上 表 
达 的 一 个 关注 是 ， 在 射电 望远镜 上 收集 并 通过 互联 网 发 送 的 数字 信号 有 可 能 把 地 球 的 互联 网 
暴露 给 了 外 星人 的 病毒 。 虽 然 这 可 以 算得 上 是 确认 了 外 星人 的 存在 ， 但 在 地 球 上 尚未 检测 到 
外 星人 的 病毒 。 无 论 如 何 ,“ 外 星 文明 探寻 之 家 ”被 认为 是 有 史 以 来 最 大 的 网 格 / 集群 计算 。 

Folding@home (蛋白质 折 肥 之 家 ) 是 一 项 模拟 蛋白 质 折 硬 和 错误 折 县 的 计划 ， 由 斯 坦 福 
的 Pande Group( 潘 德 小 组 ) 创立 。 它 实现 了 在 5 一 10 微 秒 范 围 内 的 蛋白 质 折 麦 模拟 ， 这 一 
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时 间 尺 度 比 以 前 认为 可 能 的 时 间 尺 度 长 数 千 倍 。 它 是 第 二 大 志愿 计算 项 目 ( 仅 次 于 “外 星 文 
明 探 寻 之 家 ”)。2007 年 9 月 16 日 ,“ 和 蛋白 质 折 膨 之 家 ”项 目 正式 宣布 达到 高 于 每 秒 1 千 万 
亿 次 浮 点 运算 操作 的 性 能 水 平 。 最 近 ， 它 被 用 来 分 析 蛋 白质 错 误 折合， 相关 工作 在 诸如 牛 海 
绵 状 脑病 (Bovine Spongiform Encephalopathy，BSE)， 即 疯牛病 等 疾病 方面 具有 应 用 价值 。 


7.6.5 ”一 个 典型 的 计算 机 集群 


在 这 里 ， 我 们 要 描述 一 个 典型 的 计算 机 集群 ， 其 拥有 98 台 双 处 理 器 计算 机 。 它 恰巧 存 
在 ， 不 过 仅仅 是 为 了 作为 此 类 集群 的 一 个 典型 案例 ， 并 且 可 以 支持 人 们 在 这 样 的 环境 中 使 用 
一 些 示 例 命 令 。 对 于 每 个 节点 而 言 ， 在 相应 计算 机 内 部 有 一 个 本 地 磁盘 和 两 个 处 理 器 ， 且 每 
台 计 算 机 的 两 个 处 理 器 共享 2GB 的 内 存 空间 。 这 98 台 计 算 机 通过 一 个 每 秒 10 千 兆 比特 传 
输 速 度 的 交换 式 以 太 局 域 网 进行 相互 通信 以 及 实现 与 互联 网 之 间 的 通信 。 另 外 ， 还 有 若干 利 
用 廉价 磁盘 郊 余 阵列 (Redundant Array of Independent Disk，RAID ; 相关 技术 将 在 第 14 章 
予以 解释 说 明 ) 技术 的 网 络 附属 存储 器 磁盘 阵列 ， 共 同 构成 100TB 的 存储 空间 。 该 集群 还 
具有 连接 到 防火 墙 的 5 个 头 节点 ， 人 允许 外 部 用 户 连接 到 集群 或 若干 专用 的 数据 库 服务 器 。 在 
防火 墙 外 面 ， 还 有 一 些 万 维 网 服务 器 ( Web server， 或 称 为 网 站 服务 器 ) 用 来 完成 有 关系 统 
的 一 般 状 态 和 信息 的 处 理 。 

每 个 计算 机 节点 都 运行 着 一 个 作为 操作 系统 的 单独 但 完全 相同 的 Linux 副本 ， 而 且 每 个 
节点 安装 有 常用 的 软件 ， 例 如 操作 系统 实用 程序 、 高 级 语言 编译 器 、 库 和 若干 科学 应 用 程 
序 。 各 个 计算 节点 和 存储 设备 是 与 互联 网 隔离 开 来 的 ， 相 关 访 问 须 通过 上 面 提 到 的 头 节 点 进 
行 授 权 。 头 节点 上 运行 着 集群 软件 ， 允 许 用 户 登 录 到 头 节点 并 通过 使 用 PBS (Nortable Batch 
System， 轻 便 型 批 处 理 系 统 ; 现在 称 为 TORQUE， 全称 为 Terascale Open-source Resource 
and QUEue Manager， 即 万 亿 级 开源 资源 与 队列 管理 器 ; 但 仍然 几乎 总 是 称 为 PBS) 运行 多 
个 并 行 作 业 。 头 节点 还 负责 执行 监控 以 及 一 些 其 他 的 记 账 工作 ,但 是 其 主要 是 设计 用 作 提 供 
在 多 个 计算 节点 上 运行 实际 工作 流 服务 的 门户 。 


7.6.6 ”Globus 集群 的 使 用 


集群 上 的 Linux 操作 系统 可 以 很 好 地 支持 双 处 理 器 节点 以 及 两 个 处 理 器 上 的 调度 管理 。 
相关 操作 系统 并 不 清楚 它们 是 集群 的 组 成 部 分 。 集 群 运营 管理 是 由 运行 在 操作 系统 上 的 中 间 
件 而 非 通过 修改 操作 系统 来 完成 的 。 称 为 PBS 的 中 间 件 调度 程序 是 免费 软件 ， 且 其 下 面 就 
是 Linux 操作 系统 。 虽 然 PBS 是 具有 许多 接口 的 复杂 系统 ， 但 是 一 般 而 言 ， 用 户 仅 需 知 道 
几 条 命令 就 可 以 有 效 地 对 其 加 以 使 用 。 

首先 ， 用 户 必 须 得 告诉 PBS 想 要 什么 样 的 处 理 器 资源 ， 有 具体 可 以 在 单独 的 行 上 指定 各 
个 参数 ， 如 下 所 示 : 

#PBS -M dave@mymailer.uta.edu 

#PBS -1 nodes=10:ppn=2 

#PBS -1 cput=02:00:00 


#PBS -1 mem=213mb 
#PBS -1 walltime=00:20:00 


或 者 也 可 以 把 最 后 4 行 整合 到 一 起 ， 具 体 为 : 


#PBS -1 
nodes=10:ppn=2,cput=2:00:00,mem=213mb,walltime=00:20:00 





118  ” 淄 二 部 分 洲 进 式 欧 建 胡 作 夭 统 : 面向 广 尾 的 螺 歼 式 方 法 


这 条 PBS 命令 用 来 申请 10 个 节点 ， 且 每 个 节点 要 求 有 两 个 处 理 器 ， 同 时 还 申请 213MB 的 
145| 内 存 。 该 命令 请 求 总 共 两 个 小 时 的 处 理 器 运行 时 间 以 及 20 分 钟 的 挂钟 时 间 用 来 运行 用 户 即 
将 提交 的 所 有 工作 流 。 而 参数 M 则 用 来 告知 系统 : 用 户 到 底 是 谁 。 
为 了 查看 程序 的 执行 结果 ， 用 户 需 要 告诉 系统 正常 的 输出 流 和 错误 输出 流 应 该 传输 到 什 
么 地 方 。 在 这 里 ， 它 们 被 重 定向 到 了 相关 文件 ， 以 便 后 面 可 以 提取 对 应 结果 : 


#PBS -oo outputfile 
#PBS -e errorfile 


鉴于 有 关 作业 可 能 需要 一 段 时 间 才 能 完成 ( 几 周 甚至 几 个 月 ， 在 某 些 情况 下 甚至 是 在 大 型 网 
格 系统 上 )， 为 此 ， 用 户 可 以 要 求 在 作业 开始 运行 时 发 送 一 份 电子 邮件 ， 同 时 在 作业 终止 或 
中 止 时 再 另外 发 送 一 份 电子 邮件 : 


#PBS -m bae 


最 后 ， 有 关 操 作 系统 需要 知道 即将 运行 的 程序 的 存放 位 置 : 


cd /temp/my working dir 

echo "I am running on host '‘'hostname'" 
execute my program 

rm ./junk 

exit 


特别 需要 说 明 的 是 ， 用 户 请 求 有 关 操 作 系 统 运行 一 些 程序 ， 可 能 是 以 不 同 的 文件 作为 输 
和 数据， 同时 还 可 能 要 求 在 清除 任何 残存 的 临时 文件 之 后 再 退出 。 请 注意 ， 用 户 经 常会 将 所 
有 这 些 命 令 放 到 一 个 shell 脚本 文件 中 ， 然 后 运行 该 脚本 文件 即 可 。 

利用 PBS 提交 作业 的 用 户 需 要 牢记 ， 该 系统 是 一 个 面向 批 处 理 的 系统 。 而 大 多 数 现代 
的 操作 系统 从 根本 上 来 讲 是 交互 式 的 系统 一 一 当 单 击 图 标 告诉 操作 系统 来 运行 一 道 作 业 时 ， 
系统 会 立即 尝试 启动 相应 作业 。 但 在 批 处 理 系统 中 ， 对 应 作业 有 可 能 无 法 立即 启动 运行 ， 比 
如 可 能 是 因为 所 请 求 的 资源 当时 还 无 法 使 用 。 因 此 ， 有 关 作 业 可 能 先是 被 放置 在 一 个 队列 中 
然后 才 会 被 调度 执行 。 为 此 ， 用 户 可 以 使 用 许多 命令 来 管理 相应 的 作业 和 队列 。 这 里 简要 说 





明 其 中 的 几 种 命令 : 
#qalter 用 于 更 改 一 道 批 处 理 作业 
#qdel 用 于 删除 一 道 批 处 理 作业 
#qhold 用 于 挂 起 一 道 批 处 理 作业 
#qmove 用 于 把 一 道 批 处 理 作 业 移 到 另 一 个 队列 上 
#qrls 用 于 炙 放 被 挂 起 的 批 处 理 作 业 
#qrerun 用 于 重新 运行 一 道 批 处 理 作业 
#qselect 用 于 选择 一 个 特定 的 作业 子 集 
#qstat 用 于 显示 批 处 理 作业 的 状态 
对 于 那些 不 习惯 命令 行 界面 的 用 户 ， 还 可 以 选择 使 用 一 个 称 为 XPBS 的 图 形 化 用 户 界面 
版 本 的 PBS。 


7.6.7 “门户 和 万 维 网 界面 
当 一 个 应 用 程序 在 集群 上 投入 使 用 之 后 ， 有 可 能 希望 将 其 提供 给 其 他 人 员 访 问 ， 无 论 是 
在 一 个 群 组 内 还 是 在 更 广泛 的 社区 内 部 。 或 者 用 户 可 能 只 是 想 要 一 个 易于 使 用 的 能 够 访问 应 
[146| 用 程序 的 接口 。 在 过 去 ， 可 能 会 选择 创建 一 个 窗口 界面 ， 当 然 目 前 还 有 许多 应 用 程序 仍然 是 
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这 样 做 的 。 不 过 ， 现 在 也 可 以 让 网 格 的 工作 流 或 应 用 程序 是 基于 万 维 网 方式 的 。 

门户 就 是 服务 器 计算 机 ， 其 允许 用 户 访问 数据 、 应 用 程序 、 信 息 ， 并 共享 相应 结果 。 对 
于 本 地 门户 而 言 ， 允 许 任何 人 进行 登录 、 查 看 正在 开展 的 研究 、 匹 配 教 职 研究 人 员 的 兴趣 ， 
以 及 申请 一 个 账户 。 而 账户 持 有 人 则 可 以 访问 本 地 应 用 程序 、 获 取 数 据 集 、 与 在 线 用 户 聊天 
以 及 分 享 数据 和 观点 。 


7.7 ”小结 


在 本 章 之 前 ， 我 们 曾经 讨论 了 运行 在 单 台 机 器 上 的 操作 系统 的 设计 。 而 现代 系统 经 常 按 
照 许 多 处 理 器 一 起 使 用 的 应 用 场景 来 进行 设计 。 为 此 ， 在 本 章 中 , 我们 讨论 了 多 个 处 理 器 上 
的 计算 以 及 在 构建 和 使 用 这 些 系统 时 所 出 现 的 一 些 困难 。 我 们 介绍 了 多 处 理 器 系统 的 若干 常 
见 的 设计 方案 以 及 一 些 不 太 常 见 的 设计 方案 。 在 引入 和 定义 了 一 些 关键 概念 之 后 ， 我 们 讨论 
了 一 点 并 行 计 算 的 理论 以 及 有 关 计 算 模型 和 编程 的 问题 。 然 后 ， 我 们 讨论 了 分 布 式 系统 的 一 
些 常见 体系 结构 。 关 于 在 此 类 环境 中 运行 的 操作 系统 的 设计 而 言 ， 往 往 会 涉及 在 单 处 理 情况 


下 不 会 出 现 的 特殊 考虑 ， 所 以 我 们 介绍 了 在 分 布 式 系 统 中 的 操作 系统 所 面临 的 一 些 额 外 的 问 


题 。 相 关 问 题 包括 需要 管理 哪些 方面 、 多 处 理 器 系统 资源 管理 与 单 处 理 器 系统 资源 管理 有 何 
不 同 以 及 向 程序 员 和 用 户 呈 现 什么 样 的 界面 等 。 最 后 ， 我 们 还 讨论 了 一 些 按 分 布 式 系统 设计 
实现 的 实际 的 应 用 系统 ， 其 中 还 就 某 网 格 中 的 一 个 典型 的 集群 系统 进行 了 探讨 。 

在 本 书 的 下 一 部 分 中 ,我 们 将 针对 操作 系统 的 各 个 主题 展开 更 深入 地 讨论 。 


Dubois. M.. and F. A. Briggs, “Synchronization, Geer, D., “For Programmers, Multicore Chips Mean 
Coherence. and Event Ordering in Multiprocessors,” Multiple Challenges,” Computer, Volume 40, Issue 
Computer, Vol. 21. No. 2, February 1988, pp. 9-21. 9, September 2007, pp 17-19. 
http://www.globus.org ( Globus 联 盟主 页 ) http:/Wboinc.berkeley.edu/ 〈 伯克利 开放 式 网 络 计算 
http://www.globustoolkit.org ( 用 于 构建 网 格 平台 (BOINC ) 主页 一 一 “外 星 文明 探寻 之 
的 开源 软件 工具 包 ) 家 ” (SETI) 项 目 ,等 等 ) 
习题 


7.1 根据 摩尔 定律 计算机 每 时 每 刻 都 在 变 得 越 来 越 快 。 那么 ， 为 什么 我 们 还 要 不 嫌 麻 烦 、 费 力 地 来 
构建 集群 系统 并 追求 其 他 奇特 的 而 且 要 求 程序 员 在 设计 中 努力 利用 任何 可 能 的 并 行 性 的 设计 方 
案 呢 ? 

7.2 ”对 称 多 处 理 器 系统 和 集群 (几乎 ) 总 是 在 每 个 节点 上 使 用 相同 的 处 理 器 , 但 网 格 系统 则 可 以 在 每 
个 节点 中 使 用 不 同 的 处 理 器 。 这 是 否 正 确 ? | 

7.3 ”关于 集群 系统 中 的 节点 的 描述 ， 下 面 哪 一 项 是 正确 的 ? 

a. 它们 共享 单一 内 存 。 . 

b. 它们 没有 本 地 外 设 。 

c. 它们 通过 单独 的 专用 局 域 网 进行 通信 。 

d. 在 专用 节点 上 运行 操作 系统 。 

e. 以 上 有 关 “ 集 群 系统 中 的 节点 ”的 说 法 均 不 正确 。 
7.4 管道 流 是 其 间 并 行 性 可 被 利用 的 工作 流 的 示例 。 这 是 否 正确 ? 
7.5 ”关于 工作 流 的 加 速 ， 阿 姆 达尔 定律 是 如 何 描述 的 ? 
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如 下 在 单 处 理 器 系统 中 使 用 的 通用 技术 中 ， 什 么 技术 允许 程序 员 在 对 称 多 处 理 系统 上 利用 并 
行 性 ? 

a. 内 存 映射 文件 

b. 多 线程 

c. 临界 区 

d. 信号 量 

e. 以 上 都 不 是 

什么 常见 的 硬件 技术 要 求 对 称 多 处 理 调 度 程序 为 进程 调度 做 出 了 一 些 特 殊 的 规定 ? 

在 集群 系统 上 运行 的 分 布 式 应 用 程序 为 了 利用 并 行 性 而 经 常 使 用 的 机 制 相 对 应 的 术语 是 什么 ? 
如 下 在 对 称 多 处 理 系 统 或 集群 中 所 使 用 的 技术 中 ， 哪 些 技 术 也 可 用 于 网 格 系统 中 的 分 布 式 处 理 ? 
a. 多 线程 

b. 远程 方法 调用 (RMI) 

c. 虚拟 系统 

d. 通用 对 象 请 求 代 理 体系 结构 (CORBA) 

e. 以 上 都 不 是 

在 单 处 理 器 系统 中 ， 当 共享 内 存 被 多 个 进程 访问 时 ,我 们 必须 使 用 临界 区 来 对 其 进行 保护 。 为 
什么 我 们 通常 在 集群 和 网 格 上 不 需要 使 用 这 样 的 机 制 ? 

对 于 分 布 式 系统 中 的 大 多 数 故 障 来 说 ， 通 常 应 当 采 用 什么 机 制 来 减轻 呢 ? 

如 何在 多 处 理 计算 机 系统 上 进行 工作 任务 的 分 配 ? 

如 何在 集群 计算 系统 上 进行 工作 任务 的 分 配 ? 

如 何在 志愿 计算 系统 上 进行 工作 任务 的 分 配 ? 

如 何在 Globus 系统 中 进行 工作 任务 的 分 配 ? 


| 第 三 部 分 


Operating Systems: A Spiral Approach 


处 理 硕 管理 及 内 存 管 理 





本 书 的 第 三 一 五 部 分 和 大 多 数 操作 系统 教材 的 主要 部 分 类 似 。 这 些 部 分 就 操 
作 系 统 的 各 个 方面 进行 了 深入 的 讨论 。 特 别 地 ， 第 三 部 分 围绕 所 有 现代 操作 系统 
必须 要 处 理 的 一 些 比较 基础 的 问题 进行 了 介绍 ， 包 括 进 程 、 线 程 管理 以 及 内 存 管 
理 ， 而 这 两 类 管理 则 共同 构成 了 操作 系统 的 两 大 主要 部 分 。 

本 部 分 共有 4 章 组 成 。 前 两 章 主要 介绍 了 进程 、 线 程 以 及 它们 是 如 何 通信 和 和 
相互 影响 的 。 进 一 步 说 ， 第 8 章 给 出 了 进程 的 定义 ， 并 针对 进程 管理 及 调度 方面 
的 数据 结构 和 算法 的 演化 展开 了 讨论 。 另 外 ， 该 章 还 定义 了 线程 的 概念 ， 并 阐明 
了 线程 是 如 何 使 用 和 实现 的 。 

当 开 发 对 操作 系统 具有 更 高 要 求 的 高 性 能 系统 时 ， 常 常 有 必要 把 对 应 系统 分 
解 成 几 个 独立 的 部 分 并 允许 它们 独立 地 运行 。 为 此 ， 第 9 章 就 我 们 为 什么 会 经 常 
设计 出 由 多 个 进程 或 线程 所 组 成 的 系统 的 理由 进行 了 阐述 。 而 这 样 的 话 ， 相 关 多 
个 进程 就 需要 彼此 通信 和 相互 协作 。 正 因 如 此 ， 这 一 章 还 详细 讨论 了 进程 间 通 信 
的 有 关机 制 ， 然 后 指出 了 此 类 通信 过 程 中 易 犯 的 一 些 错误 和 所 牵涉 的 问题 ， 进 而 
引入 了 同步 的 概念 以 及 由 此 可 能 导致 的 死 锁 问 题 。 

这 一 部 分 的 最 后 两 章 则 针对 内 存 管 理 的 相关 问题 展开 讨论 。 第 10 章 介绍 了 
简单 系统 中 的 内 存 管 理 。 从 某 种 程度 上 来 讲 ， 有 些 内 容 已 经 成 为 历史 ， 然 而 在 现 
在 却 明摆着 ， 伴 随 计 算 机 硬件 的 小 型 化 ， 意 味 着 我 们 将 继续 在 资源 稀缺 的 环境 条 
件 下 去 探索 计算 机 的 奥秘 ， 而 这 些 简单 的 方法 和 技术 也 将 在 可 以 预见 的 未 来 继续 
得 到 应 用 和 发 挥 一 定 的 作用 。 

第 11 章 则 阐述 了 大 型 系统 中 的 内 存 管理 机 制 。 分 页 和 分 段 是 内 存 管 理 演化 
过 程 中 形成 的 两 种 主要 技术 。 该 章 首先 介绍 了 这 两 种 技术 的 工作 机 理 ， 然 后 阐明 
了 有 效 的 内 存 访问 时 间 的 概念 以 及 分 页 或 分 段 后 的 内 存 可 能 受到 的 影响 。 在 此 基 
础 上 ， 引 入 了 地 址 转换 后 援 缓冲 机 制 〈 即 快 表 ) 的 思想 ， 并 论述 了 这 种 机 制 是 如 
何 缓解 相关 问题 的 。 接 下 来 ， 该 章 还 解释 了 虚拟 内 存 的 概念 ， 并 讨论 了 着 拟 内 存 
管理 相关 的 一 些 算 法 。 
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在 本 章 中 ， 我 们 将 讨论 进程 和 线程 。 操 作 系 统 的 一 项 基本 功能 就 是 执行 程序 ， 而 正在 执 
行 的 程序 称 为 进程 。 程 序 是 静态 的 东西 。 在 大 多 数 操作 系统 中 ， 程 序 存储 在 辅助 存储 器 上 的 
文件 中 。 最 后 ， 往 往 是 由 用 户 ， 但 有 时 也 会 是 另 一 个 进程 ， 甚 至 可 能 是 运行 在 另 一 个 系统 上 
的 进程 ， 指 示 着 操作 系统 去 执行 程序 。 于 是 ， 操 作 系 统 将 该 程序 调 入 主 存 并 开始 执行 它 。 那 
个 正在 执行 的 实体 被 称 为 进程 ( process)。 需 要 注意 的 是 ,我们 可 以 在 一 个 系统 上 同时 执行 
同一 个 程序 的 多 个 副本 。 例 如 ， 可 能 启动 了 程序 开发 环境 的 多 个 副本 同时 执行 。 对 应 程序 的 
每 个 执行 副本 都 将 是 一 个 单独 的 进程 。 常 用 来 描述 进程 的 其 他 术语 还 包括 作业 (job) 或 任务 
(task)。 

在 第 8.1 节 中 ,我 们 将 给 出 进程 的 定义 ， 并 讨论 关于 “进程 运行 所 基于 的 机 器 平台 ”的 
抽象 概念 。 操 作 系统 必 须 跟踪 有 关 每 个 正在 执行 的 进程 的 大 量 的 信息 ， 特 别 是 当 相 应 进程 实 
际 上 并 不 是 正在 处 理 器 上 运行 时 。 在 第 8.2 节 中 ,我 们 解释 了 操作 系统 用 来 存储 这 些 数据 的 
主要 的 进程 控制 结构 ， 即 进程 控制 块 。 当 一 个 进程 执行 时 ， 它 将 会 处 于 各 种 不 同 的 状态 ， 如 
准备 就 绪 即 将 运行 、 正 在 运行 、 等 待 ， 等 等 。 各 种 类 型 的 事件 会 导致 进程 从 一 种 状态 转换 
到 另 一 种 状态 。 第 8.3 节 就 讨论 了 进程 可 能 所 处 的 各 种 状态 以 及 可 以 引起 状态 之 间 转 换 的 事 
件 。 当 系统 中 正在 执行 多 个 进程 时 ， 操 作 系 统 必 须要 决定 下 一 个 即将 运行 的 应 该 是 哪 一 个 进 
程 。 第 8.4 节 讨 论 了 用 来 调度 进程 加 以 运行 的 各 种 算法 。 为 了 使 一 个 复杂 的 应 用 程序 能 够 同 
时 完成 许多 事情 ， 有 时 希望 进程 启动 另外 的 一 个 进程 来 完成 某 些 工作 ， 因 而 ， 第 8.5 节 诠 释 
了 一 个 进程 如 何 启动 另 一 个 进程 的 问题 。 

进程 间 切换 已 被 证 实 对 操作 系统 及 其 所 执行 的 程序 的 性 能 具有 非常 重要 的 影响 。 为 此 ， 
又 提出 了 另外 一 种 机 制 ， 即 允许 一 个 单独 的 进程 通过 利用 线程 机 制 来 同时 完成 更 多 的 事情 ， 
第 8.6 节 将 就 此 予以 阐述 。 在 第 8.7 节 中 ， 我 们 讨论 了 在 一 些 不 同 的 操作 系统 中 的 线程 的 一 
些 真正 的 实现 机 制 ， 在 许多 操作 系统 提供 的 标准 线程 应 用 程序 接口 以 及 一 些 高 级 程序 设计 语 
言 中 ， 也 支持 线程 的 使 用 ， 因 此 我 们 在 这 一 节 中 还 就 相关 话题 进行 了 介绍 。 最 后 ， 在 第 8.8 
节 ， 我 们 对 全 章 内 容 进 行 了 归纳 总 结 。 


8.1 引言 


当 进 程 运 行 时 ， 它 将 会 改变 自己 的 状态 (state)。 最 显而易见 的 是 ， 它 将 会 在 运行 时 及 
调用 子 程序 、 函 数 、 方 法 或 者 循环 等 情况 下 ， 改 变 程序 计数 器 (或 指令 地 址 寄存 器 ) 的 内 容 。 
在 大 多 数 机 器 上 ， 它 至 少 还 会 改变 (处 理 器 的 ) 各 种 寄存 器 、 系 统 状态 寄存 器 和 栈 指针 的 内 
容 。 这 些 数据 项 (以 及 稍 后 讨论 的 其 他 数据 项 ) 统称 为 进程 状态 。 如 果 我 们 在 一 个 系统 上 仅 
仅 运行 一 个 进程 ， 那 么 对 进程 状态 没有 什么 更 多 要 说 的 。 但 是 现在 ,我们 通常 运行 的 不 止 一 
个 进程 。 我 们 会 在 许多 进程 之 间 快 速 地 切换 ， 以 试图 让 硬件 保持 忙 忙碌 碌 的 工作 状态 ， 并 对 
用 户 及 时 地 响应 。 

尽管 我 们 希望 系统 能 够 同时 执行 许多 进程 ， 但 同时 我 们 还 希望 进程 间 的 这 种 切换 对 于 进 


贫 8 茧 进程 营 理 : 砚 念 、 线 程 和 和 调度 123 


程 本 身 来 说 是 透明 的 ( 即 进程 不 需要 知道 自己 是 否 或 何 时 会 被 挂 起 从 而 让 另外 一 个 进程 启动 
运行 )。 为 此 ， 我 们 正在 创建 一 个 “虚拟 处 理 器 ”", 也 就 是 说 ， 每 个 进程 都 可 以 像 它 是 唯一 运 
行 的 进程 那样 运行 。 因 为 我 们 要 完成 进程 间 切 换 的 所 有 事项 ， 所 以 ， 当 我 们 停止 一 个 进程 和 
启动 另 一 个 进程 时 ， 我 们 必须 保存 将 要 停止 的 进程 的 状态 ， 并 恢复 我 们 即将 启动 的 进程 的 先 
前 状态 。( 这 里 假定 ， 我 们 开始 执行 的 进程 不 是 一 个 新 的 过 程 。) 我 们 将 会 在 内 存 中 创建 一 个 
结构 ， 以 保存 用 来 描述 被 停止 进程 的 状态 的 信息 。 我 们 称 之 为 进程 控制 块 ( Process Control 
Block，PCB )。 一 些 操作 系统 则 把 这 个 结构 称 为 进程 描述 符 (process descriptor)。 
8.2 ”进程 描述 符 一 “进程 控制 志 

正如 刚才 所 描述 的 ， 当 一 个 进程 由 于 任何 原因 被 操作 系统 停止 运行 时 ， 此 时 的 处 理 器 的 
状态 将 被 保存 在 该 进程 的 进程 控制 块 中 。 进 程控 制 块 中 还 有 许多 其 他 的 信息 。 典 型 的 进程 控 
制 块 所 含 内 容 如 图 8-1 所 示 。 不 同 的 操作 系统 会 在 进程 控制 块 中 保持 不 同 的 信息 ， 但 以 下 信 
息 通 常 是 共有 的 : 

e 程序 名 
进程 标识 符 ， 由 操作 系统 分 配 ， 用 以 标识 进程 的 一 个 编号 
父 进 程 标识 符 或 指向 父 进程 的 进程 控制 块 的 指针 
指向 子 进程 的 进程 控制 块 的 链表 的 指针 
指向 “下 一 个 ”进程 控制 块 的 指针 ， 可 能 是 在 某 个 队列 中 
资源 清单 
指向 打开 文件 表 的 指针 
处 理 器 状态 信息 : 
香 指令 计数 器 
到 栈 指 针 
和 系统 状态 寄存 器 
@ 其 他 的 系统 寄存 器 
事件 描述 符 ， 当 进程 正在 等 待 某 事件 时 方 有 效 
进程 状态 信息 ( 详 见 下 一 节 内 容 ) 
进程 所有 者 (用户) 
内 存 管理 信息 
指向 某 种 消息 队列 的 指针 

e 指向 某 种 事件 队列 的 指针 

当 进 程 确 确实 实地 正在 运行 时 ， 处 理 器 的 状态 信息 并 不 会 被 更 新 ， 认 识 到 这 一 点 非常 重 
要 。 只 有 当 进 程 由 于 某 种 原因 被 停止 运行 时 ， 才 会 保存 该 进程 的 处 理 器 状态 信息 。 请 注意 ， 
术语 “状态 ”被 “ 重 载 ” 和 用 到 了 多 个 地 方 。 我 们 一 直 在 谈论 处 理 器 的 “状态 " ， 并 声称 当 
我 们 停止 一 个 进程 时 ， 我 们 会 将 这 些 信息 保存 在 进程 控制 块 中 ， 并 称 之 为 “处 理 器 状态 信 
息 ”。 或 许 你 已 经 注意 到 ， 进 程控 制 块 中 还 有 男 外 一 个 称 为 “进程 状态 信息 ”的 信息 项 。 这 
与 “处 理 器 状态 信息 ”是 两 码 事 ， 下 一 节 将 会 具体 介绍 。 153 


8.3 进程 状态 和 转换 
操作 系统 的 设计 人 员 必须 就 其 系统 的 外 部 视图 提供 相应 的 文档 ， 以 便 使 编程 人 员 清楚 如 
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何 为 对 应 的 系统 编写 程序 ， 而 用 户 也 能 知道 应 该 如 何 运行 这 些 程序 。 其 中 ， 某 些 需要 讨论 的 
事情 可 以 采用 若干 方式 来 进行 描述 ， 关 于 一 个 进程 可 能 所 处 的 “状态 ”的 概念 就 是 这 样 的 一 
个 例子 。 对 于 一 个 进程 来 说 ， 最 显而易见 的 状态 是 其 正在 运行 。 但 是 ,任何 时 候 每 个 处 理 器 
上 只 能 有 一 个 进程 正在 运行 ， 那 么 此 时 其 他 进程 在 做 什么 呢 ? 其 中 一 些 进程 已 为 运行 做 好 准 
备 和 蓄 势 竺 发， 而 还 有 一 些 进程 则 正在 等 竺 发 生 其 他 某 类 事件 ， 然 后 才能 继续 运行 。 


| 
， 指向 下 一 个 进程 控制 块 的 指针 
指向 父 进程 的 进程 控制 块 的 指针 






图 8-1 进程 控制 块 


不 同 的 设计 人 员 (和 作者 ) 往往 会 采用 不 同 的 模型 来 解释 操作 系统 对 进程 的 管理 。 在 第 
2 章 中 ,我 们 介绍 了 具有 不 同 状态 和 转换 标签 的 五 状态 模型 ， 但 是 ， 去 除了 其 中 的 新 状态 和 
终止 状态 的 三 状态 模型 (three-state model) 也 很 常见 。 在 这 里 ， 再 次 展现 五 状态 模型 ， 如 
8-2 所 示 。 用 状态 图 ( state diagram) 来 描述 这 些 状 态 是 非常 方便 的 ， 状 态 (或 结 点 ) 由 六 
边 形 来 表示 ， 而 箭头 (或 转换 ) 则 对 应 导致 从 一 个 状态 转换 到 另 一 个 状态 的 事件 。 这 5 种 状 
态 是 新 状态 、 就 绪 状 态 、 运 行 状 态 、 等 待 状态 和 终止 状态 。 这 些 状 态 在 其 他 参考 书 中 常常 会 
有 不 同 的 名 称 。 

新 状态 表示 操作 系统 当前 正 准 备 运行 但 尚未 
准备 就 绪 的 进程 。 当 用 户 告知 命令 处 理 器 模块 要 
执行 一 个 程序 时 ， 该 程序 将 经 过 标记 为 “0- 程序 
被 加 载 ” 的 转换 ， 并 被 置 为 新 状态 。 操 作 系 统 首 
先 会 为 其 创建 一 个 新 的 进程 控制 块 ， 分 配 一 个 进 
程 标识 符 ， 并 填写 所 有 其 他 的 进程 控制 块 参数 。 
然后 ， 操 作 系统 将 为 其 分 配 内 存 ， 并 把 对 应 程序 
从 辅助 存储 器 读 入 内存， 等 等 。 特 别 是 在 多 处 理 
器 系统 上 ， 我 们 并 不 希望 运行 在 另 一 个 处 理 器 上 
的 操作 系统 实例 尝试 去 调度 这 个 进程 ， 因 此 直到 
它 真正 准备 好 可 以 运行 之 前 ， 其 一 直 被 标记 为 是 
处 于 新 状态 。 

当 一 个 进程 为 运行 准备 妥当 时 ， 其 就 被 置 为 
就 绪 状 态 。 这 被 看 作 “1- 进程 初始 化 ”转换 。 最 
终 ， 对 应 进程 将 被 操作 系统 选择 为 下 一 个 要 运行 图 8-2 五 状态 进程 模型 
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的 进程 ， 然 后 该 进程 将 被 调度 分 派 ( dispatch， 即 其 将 被 置 为 运行 状态 )。 相 应 转换 由 标记 为 
“2- 获得 处 理 器 时 间 ” 的 箭头 来 标示 。 当 一 个 进程 正在 运行 时 ， 它 可 能 决定 在 其 继续 运行 之 
前 需 等 待 其 他 某 件 事 情 发 生 。 一 个 很 常见 的 原因 是 ， 该 进程 已 经 请 求 了 同步 输入 / 输出 操作 
( 璧 如， 普通 的 高 级 语言 的 读 操作 ) 并 且 打 算 一 直 要 等 到 对 应 操作 完成 ， 因 此 该 进程 便 被 转 
换 到 了 等 待 状态 ， 有 时 被 称 为 暂停 (suspend) 状态 。 相 应 转换 被 标记 为 “3- 需要 某 样 东西 ” 。 
我 们 稍 后 将 会 看 到 ， 一 个 进程 可 能 等 待 的 事件 有 许多 不 同 的 类 型 。 当 一 个 进程 处 于 等 待 状态 
时 ， 该 进程 正在 等 待 的 事件 迟早 可 能 会 发 生 。( 当 然 ， 也 有 可 能 相应 事件 永远 不 会 发 生 ， 例 
如 ， 一 个 进程 正在 等 待 可 能 的 错误 的 或 者 关于 极 少 使 用 的 服务 的 传人 请 求 。) 作为 这 种 转换 
的 一 个 例子 来 讲 ， 可 能 是 一 个 进程 请 求 的 输入 /输出 已 经 完成 。 相 应 转换 被 标记 为 “4- 获 
得 所 需 的 东西 "， 并 且 操 作 系 统 将 把 对 应 进程 置 为 就 绪 状 态 。 这 个 模型 的 下 一 个 转换 被 标记 
为 “5- 被 中 断 ”。 操 作 系统 可 以 拥有 好 多 理由 来 选择 中 断 一 个 正在 运行 的 进程 ， 但 并 非 所 有 
的 操作 系统 都 会 这 么 做 。 第 一 种 情况 是 一 个 分 时 系统 ， 其 中 每 个 进程 依次 被 赋予 少量 的 时 间 
来 执行 。 如 果 其 中 的 一 个 进程 在 分 配给 它 的 时 间 里 ， 没 有 做 过 什么 事情 使 其 进入 等 待 状态 ， 
但 又 没有 结束 ， 那 么 操作 系统 将 使 其 退出 运行 状态 ， 并 将 其 置 为 就 绪 状 态 ， 进 而 允许 另外 一 
个 进程 去 运行 。 第 二 种 情况 是 ， 一 个 具有 高 优先 级 别 的 进程 一 直 在 等 待 某 个 事件 ， 而 这 时 其 
所 等 待 的 事件 发 生 了 。 如 果 正 在 运行 的 进程 的 优先 级 别 要 低 于 正在 等 待 的 那个 进程 的 优先 级 
别 ， 那 么 ， 操 作 系统 可 能 会 中 断 较 低 优先 级 别 的 进程 ， 使 其 返回 到 就 绪 状 态 ， 并 将 较 高 优先 
级 别 的 进程 置 为 运行 状态 。 不 过 ， 并 不 是 所 有 的 操作 系统 都 会 使 用 优先 级 调度 。 

终止 状态 是 为 由 操作 系统 结束 的 进程 而 专门 准备 的 。 可 能 有 很 多 原因 会 使 一 个 进程 到 达 
这 种 状态 ， 对 应 转换 被 标记 为 “6- 完成 或 中 止 " 。 完 成 是 显而易见 的 。 而 中 止 也 是 很 清楚 的 ， 
无 论 是 进程 还 是 操作 系统 检测 到 任何 问题 ， 相 应 进程 都 会 在 更 多 损坏 发 生 之 前 被 中 止 。 但 
是 ， 也 有 其 他 一 些 原因 会 使 一 个 进程 可 能 从 运行 状态 转 入 终止 状态 。 例 如 ， 某 个 进程 的 父 进 
程 可 能 判定 该 子 进程 不 再 需要 ; 于 是 请 求 操作 系统 杀 死 该 子 进程 。 在 大 多 数 情况 下 ， 我 们 并 
不 想 弄 乱 这 个 模型 ， 因 此 ,我 们 在 这 张 图 里 忽略 了 这 些 很 罕见 的 转换 。 

终止 状态 是 相当 特殊 的 ， 进 程 不 会 在 该 状态 停留 很 长 时 间 ， 但 相关 进程 并 不 是 正在 运 
行 、 准 备 就 绪 或 等 待 某 事 发 生 ， 故 而 我 们 可 以 理所当然 地 把 终止 状态 作为 某 种 不 同 于 其 他 状 
态 的 东西 来 进行 讨论 。 操 作 系统 将 需要 为 对 应 进程 做 一 些 善后 处 理 ， 例 如 释放 进程 可 能 已 经 
获得 但 尚未 返还 的 资源 、 确 保 文 件 均 已 关闭 以 及 把 相应 的 进程 控制 块 从 对 应 进程 上 拆 下 。 在 
资源 完全 恢复 之 前 ， 我 们 不 希望 选择 此 进程 来 执行 ， 因 此 我 们 在 系统 工作 的 同时 将 其 停留 在 
了 这 种 状态 。 

其 他 的 操作 系统 文档 包括 更 为 复杂 的 模型 。 在 至 少 一 种 实例 9 中 ,设计 人 员 所 采用 的 模 
型 竟然 拥有 9 种 状态 及 许多 转换 。 尽 管 这 种 系统 的 设计 人 员 可 能 觉得 有 必要 向 应 用 程序 员 解 
释 该 系统 的 一 些 特殊 的 方面 ， 但 是 ， 这 种 级 别 的 复杂 描述 在 大 多 数 的 文档 中 都 没有 看 到 过 。 

值得 注意 的 是 ， 除 了 运行 状态 ， 在 通常 情况 下 ， 可 能 有 许多 进程 同 处 于 任何 一 种 给 定 的 
状态 下 。 因 此 ， 当 发 现 “ 对 于 大 多 数 的 操作 系统 而 言 ， 往 往 都 会 有 一 种 精心 设计 的 机 制 用 来 
跟踪 处 于 任何 一 种 其 他 状态 的 所 有 的 进程 ”的 时 候 ， 我 们 不 应 该 感到 惊奇 。 就 绪 状 态 将 由 至 
少 一 个 结构 组 成 ， 我 们 通常 将 其 称 为 就 绪 队 列 〈ready queue)， 但 在 技术 上 ， 我 们 经 常会 以 
其 他 方式 对 其 进行 使 用 ， 而 不 是 采用 绝对 的 队列 操作 方式 。 事 实 上 ， 其 可 能 是 多 个 链表 。 我 
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们 将 会 在 下 一 节 进 一 步 讨 论 这 一 点 。 运 行 状态 只 包含 一 个 进程 ， 除 非 是 多 处 理 器 系统 。 在 那 
种 情况 下 ， 在 各 个 处 理 器 上 运行 的 进程 可 能 会 链接 到 一 个 单独 的 链表 上 , 但是， 仅仅 把 相应 
进程 从 就 绪 状态 的 链表 中 移 除 ， 也 可 能 就 足够 了 。 对 于 等 待 状态 而 言 ， 则 可 能 有 许多 队列 ， 
鉴于 处 于 等 待 状态 的 进程 有 时 是 以 先 来 先 服务 方式 进行 操作 的 ， 所 以 将 其 称 为 队列 也 是 合理 
的 。 对 于 其 他 的 场合 ， 我 们 将 实施 更 高 级 的 操作 调度 ,“ 队 列 ” 一 词 实际 上 可 能 并 不 适用 。 
不 过 ， 这 个 术语 在 操作 系统 文献 中 已 经 根深 带 固 ， 所 以 我 们 将 坚持 使 用 这 一 术语 ， 但 同时 应 
意识 到 ， 其 从 技术 角度 而 言 并 不 总 是 正确 的 。 


8.4 进程 调度 

正如 刚才 所 论述 的 ,一 个 进程 可 能 会 由 于 若干 原因 而 离开 运行 状态 。 当 这 种 情况 出 现 
时 ， 例 如 ， 如 果 进 程 因 其 时 间 份 额 用 完 而 被 中 断 ， 那 么 进程 可 能 会 立即 进入 就 绪 状 态 。 如 果 
一 个 进程 正在 等 待 某 个 事件 ， 或 许 是 在 等 待 输入 /输出 完成 吧 ， 于 是 ， 当 相应 事件 发 生 的 时 
候 ， 我 们 需要 将 该 进程 置 为 就 绪 状 态 ， 以 便 使 其 可 以 到 达 运 行 状 态 并 去 处 理 那个 事件 。 当 我 
们 将 一 个 进程 置 为 就 绪 状 态 时 ， 我 们 需要 决定 ， 相 对 于 那些 已 经 处 于 就 绪 状 态 的 进程 来 说 ， 
什么 时 候 该 进程 应 该 运行 。 这 项 决策 是 由 所 谓 的 短程 调度 器 ( short-term scheduler) 的 操作 
系统 模块 来 完成 的 。 操 作 系 统 可 以 基于 许多 方法 来 做 出 这 项 决定 。 而 我 们 可 能 想 要 设计 我 们 
自己 的 操作 系统 ， 以 便 我 们 可 以 散 入 各 种 各 样 的 短程 调度 程序 模块 ， 从 而 满足 系统 用 户 和 管 
理 员 的 需求 。 首 先 ， 我们 会 介绍 一 些 调度 算法 ,然后 会 讨论 它们 在 各 种 情况 下 的 一 些 优点 和 
缺点 。 


8.4.1” 先 来 先 服 务 调度 


最 简单 的 方法 ， 同 时 也 是 在 历史 上 曾经 被 许多 操作 系统 使 用 过 的 一 种 方法 ， 就 是 仅仅 使 
用 一 个 普通 的 队列 来 执行 先进 先 出 的 调度 。 这 称 为 先 来 先 服务 ( First Come，First Served， 
FCFS) 调度 算法 。 这 种 算法 拥有 很 多 优点 。 它 很 容易 实现 ,而 且 能 够 被 设计 人 员 、 用 户 、 
管理 员 其 至 教师 很 好 地 理解 。 还 有 一 点 ， 这 种 算法 根据 定义 来 说 应 当 是 最 公平 的 (也 就 是 
说 ， 其 在 任何 情况 下 都 不 会 特殊 偏爱 和 照顾 任何 一 个 进程 ， 即 永远 不 会 把 一 个 后 来 的 进程 提 
前 到 先 来 的 进程 的 前 面 去 执行 )。 先 来 先 服务 调度 算法 经 常会 采用 这 样 的 增强 措施 ， 即 允许 
一 个 正在 运行 的 进程 执行 一 种 可 以 把 控制 权 让 给 处 于 就 绪 状 态 的 下 一 个 进程 的 系统 调用 。 这 
被 称 为 协作 式 多 任务 ( cooperative multitasking)， 曾 经 是 包括 X 版 之 前 的 Mac 操作 系统 、 微 
软 Windows 操作 系统 以 及 许多 其 他 的 操作 系统 在 内 的 一 代 操 作 系统 的 典型 做 法 。 当 然 ， 正 
在 运行 的 进程 可 能 存在 缺陷 或 问题 ， 或 者 可 能 试图 通过 使 用 超过 其 应 当 所 得 的 更 多 的 处 理 需 
时 间 来 使 自己 获得 更 好 的 用 户 响 应 ， 因 此 这 并 不 是 一 种 理想 的 解决 方案 。 


8.4.2 优先 级 调度 


在 某 些 情况 下 ， 我 们 可 能 并 不 想 使 用 先 来 先 服务 调度 算法 。 首 先 ， 我 们 可 能 拥有 一 些 进 
程 要 比 其 他 的 进程 更 为 重要 。 在 现代 操作 系统 中 ,我们 希望 即时 地 处 理 击 键 和 鼠标 操作 ， 从 
而 使 交互 式 用 户 的 等 待 时 间 能 够 减少 到 最 小 。 我 们 想 让 操纵 着 持 有 操作 系统 焦点 的 窗口 的 进 
程 一 一 假定 我 们 正在 浏览 一 个 网 站 一 一 能 够 得 到 及 时 的 响应 。 我 们 对 可 能 正在 运行 但 当前 
并 不 持 有 焦点 的 其 他 进程 一 一 也 许 我 们 的 电子 邮件 阅读 器 正在 检查 我 们 的 邮件 服务 器 ， 去 了 
解 我 们 是 否 收 到 任何 的 邮件 一 一 的 性 能 不 太 感 兴趣 。 我 们 对 一 些 其 他 进程 一 一 比如 说 假 脱 
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机 (SPOOLING， 即 Simultaneous Peripheral Operation On-Line， 寓 意外 部 设备 联机 同时 操 
作 ) 系统 正在 打印 我 们 一 段 时 间 以 前 下 载 的 文档 的 性 能 更 不 感 兴趣 。 在 这 些 情况 下 ,我 
们 可 能 会 使 用 优先 级 ( priority) 调度 算法 。 在 优先 级 调度 算法 中 ,我 们 将 每 个 进程 与 一 个 优 
先 级 相关 联 。 我 们 的 击 键 和 鼠标 处 理 程序 可 能 是 最 高 的 优先 级 ， 持 有 焦点 的 窗口 的 优先 级 位 
居 其 次 ， 再 接 下 来 是 未 持 有 焦点 的 窗口 的 优先 级 ， 而 像 假 脱 机 系统 之 类 的 后 台 进 程 的 优先 级 
则 要 更 低 一 些 。 在 大 多 数 的 操作 系统 中 ， 通 常 都 会 有 一 个 称 为 空闲 ( idle) 进程 之 类 的 进程 ， 
该 进程 在 没有 其 他 进程 准备 就 绪 和 可 以 运行 的 时 候 加 以 执行 ,并 以 循环 结构 作为 基本 框架 。 
(请 注意 ,“ 最 高 优先 级 ”可 能 对 应 最 小 的 数 ， 而 不 是 对 应 最 大 的 数 。 这 种 选择 可 能 取决 于 计 
算 机 的 指令 集 ， 也 可 能 只 是 开发 人 员 的 一 个 随意 的 决定 而 已 。 只 要 调度 程序 是 兼容 和 一 致 
的 ， 最 小 的 数 来 代表 最 高 优先 级 是 完全 正常 的 。) 

每 当 我 们 允许 一 些 任务 优先 于 其 他 任务 时 ,往往 会 存在 一 个 我 们 不 得 不 担心 的 特殊 问 
题 。 也 就 是 说 ， 很 可 能 较 高 优先 级 的 进程 不 断 地 推迟 低 优先 级 进程 的 运行 ， 甚 至 导致 发 生 极 
端 情况 即 较 低 优 先 级 进程 从 未 运行 过 。 这 个 问题 被 称 为 饥饿 ( starvation) 问题 。 我 们 可 以 采 
用 好 多 种 方法 来 处 理 此 类 潜在 的 问题 ， 总 的 来 说 ， 这 些 方 法 都 会 用 到 一 种 所 谓 的 老龄 化 技术 
(aging)。 进 一 步 说 ， 我 们 通常 将 监视 那些 被 推迟 的 进程 ， 并 且 每 当 我 们 好 多 次 推迟 一 个 进 
程 时 ， 我 们 将 会 暂时 提高 它 的 优先 级 。 最 终 ， 它 将 会 达到 一 个 足够 高 的 优先 级 ， 使 其 运行 一 
次 。 然 后 ,我 们 再 将 其 优先 级 恢复 为 其 最 初 的 优先 级 。 这 样 ， 即 使 是 相当 低 的 优先 级 的 进程 
也 会 完成 ， 不 过 ， 较 高 优先 级 的 任务 还 是 会 被 赋予 大 部 分 的 处 理 絮 时 间 。 


8.4.3 保证 型 调度 


先 来 先 服务 调度 为 每 个 进程 提供 了 一 个 公平 的 运行 机 会 ， 但 是 ， 如 果 一 个 进程 会 执行 多 
次 阻塞 性 调用 ， 那 么 它 比 起 其 他 的 执行 阻塞 性 调用 较 少 的 进程 ， 则 并 没有 真正 获得 公平 数量 
的 处 理 机 时 间 。 要 做 下 面 这 样 的 保证 是 可 能 的 ， 也 就 是 说 ， 如 果 有 天 个 进程 在 同时 运行 ， 那 
么 可 以 保证 每 个 进程 都 获得 1/n 的 处 理 器 时 间 。 在 保证 型 调度 (guaranteed scheduling) 中 ， 
操作 系统 需要 监测 每 个 进程 已 经 使 用 的 处 理 器 时 间 总 量 及 其 分 配 获得 的 处 理 器 时 间 总 量 。 然 
后 ， 计 算 各 个 进程 的 处 理 器 实际 利用 比率 ， 即 进程 实际 使 用 处 理 器 的 时 间 总 量 与 其 分 配 获得 
的 处 理 器 时 间 总 量 的 比值 ， 并 选择 运行 具有 最 小 比率 的 进程 。 这 有 时 被 称 为 公平 分 配 调度 
(fair-share scheduling)。 从 本 质 上 而 言 ， 这 是 一 种 优先 级 调度 。 


8.4.4 ”最 短 运行 时 间 优 先 调 度 

即便 是 大 的 面向 批 处 理 的 主机 也 可 能 允许 在 作业 之 间 存 在 优先 级 别 。 具 有 代表 性 的 情况 
是 ， 开 发 新 的 作业 的 程序 员 往 往 希 望 快 速 的 作业 周转 ， 以 便 使 他 们 能 够 完成 他 们 的 工作 ， 而 
其 他 的 作业 可 以 通宵 运行 。 尽 管 如 此 ， 一 些 作 业 会 比 其 他 作业 更 为 重要 。 比 如 ， 每 个 人 都 希 
望 工资 单 准时 到 达 ! 当 在 系统 中 还 加 入 分 时 机 制 的 情况 下 ， 所 有 的 交互 式 的 基于 窗口 的 作业 
通常 会 运行 在 比 批 处 理 作业 更 高 的 优先 级 上 。 使 其 成 为 现实 的 一 种 途径 是 采用 称 为 最 短 运行 
时 间 优 先 调度 ( Shortest Run Time First，SRTF， 有 时 称 为 最 短 剩余 时 间 优 先 调度 ) 或 最 短 作 
业 优先 调度 ( Shortest Job Next，SJN) 的 算法 。 这 种 算法 是 非常 容易 理解 的 。 它 只 是 选择 运 
行 时 间 最 短 的 作业 作为 下 一 个 将 要 执行 的 作业 。 顺 便 说 一 句 ， 这 种 算法 将 会 为 所 有 的 作业 产 
生 最 短 可 能 的 周转 时 间 。 

回想 一 下 ， 当 进程 执行 时 ， 它 们 通常 会 花费 一 小 段 时 间 来 进行 计算 ， 然后 就 执行 输入 / 





128  ” 浸 三 部 分 处 理 器 常理 及 内 闻 常 理 


输出 操作 。 进 一 步 说， 交互 式 分 时 作业 通常 在 输入 /输出 操作 之 间 仅 运行 很 短 的 时 间 ， 而 大 
的 批 处 理 作业 在 执行 输入 /输出 操作 之 前 则 可 能 运行 很 长 时 间 。 因 此 ,我 们 可 以 赋予 交互 式 
作业 以 较 高 优先 级 的 一 种 方法 是 ， 基 于 进程 的 下 一 轮 处 理 器 集中 使 用 周期 且 在 执行 输入 / 输 
出 操作 之 前 的 时 间 量 来 确定 其 相应 的 优先 级 。 然 而 ， 大 多 数 的 计算 机 并 没有 安装 “具有 读 心 
术 本 事 的 程序 "， 因 此 我 们 通常 并 不 知道 进程 的 下 一 轮 处 理 器 集中 使 用 周期 究竟 会 有 多 长 时 
间 。 尽 管 如 此 ， 我 们 可 以 追踪 每 个 进程 的 以 往 的 执行 情况 ， 并 推测 其 在 下 一 轮 处 理 器 集中 使 
用 周期 的 行为 方式 将 会 像 以 往 的 几 轮 处 理 器 集中 使 用 周期 一 样 。 为 了 能 够 实现 这 种 推测 ， 我 
们 将 使 用 一 种 按 指数 方式 衰减 的 函数 。 在 此 ， 我 们 首先 设 定 如 下 的 变量 : 

7 表示 当前 进程 在 第 i 个 时 间 段 中 实际 利用 处 理 器 的 时 间 。 

;表示 我 们 推测 当前 进程 将 会 在 第 i 个 时 间 段 内 使 用 处 理 器 的 时 间 。 

同时 ， 我 们 还 设 定 参数 9 用 于 调整 性 能 ， 具 体 表 示 我 们 希望 进程 的 上 一 轮 的 处 理 器 实际 
利用 时 间 在 推测 结果 中 所 占 的 百分比 ， 因 此 ， 它 的 取 值 在 0 和 1 之 间 。 推 测 的 其 余部 分 则 将 
依据 我 们 所 做 的 上 一 轮 的 推测 结果 。 该 推测 公式 给 定 如 下 : 

BF(O*TLI)+((1-O)*ELD) 

一 般 可 把 6 初始 化 设置 为 0.5， 这 样 ， 对 这 二 时 间 段 的 推测 结果 的 一 半 是 根据 上 一 轮 的 
处 理 器 实际 利用 时 间 ， 而 另 一 半 即 (1-6) 则 根据 上 一 轮 的 推测 结果 。 每 次 我 们 做 下 一 轮 推 
测 的 时 候 ， 以 往 推测 值 和 处 理 器 实际 利用 时 间 的 影响 效果 将 会 分 别 减 半 处 理 。 这 就 是 为 什么 
该 函数 被 描述 为 按 指数 方式 衰减 ( exponentially decaying) 的 缘由 。 如 果 我 们 提高 6 的 取 值 ， 
那么 下 一 轮 的 推测 结果 将 更 多 地 建立 在 处 理 器 实际 利用 时 间 上 。 这 将 会 使 我 们 的 推测 更 快 
地 响应 处 理 器 使 用 的 变化 ， 但 我 们 将 会 趋向 于 对 小 的 波动 矫 枉 过 正 。 而 如 果 我 们 降低 9 的 取 
值 ， 那 么 我 们 将 会 获得 相反 的 效果 一 一 我 们 将 会 对 变化 的 响应 非常 迟钝 ， 但 不 会 对 小 的 波动 
反应 过 度 。 

我 们 将 使 用 这 种 推测 方法 来 选择 下 一 个 要 运行 的 进程 ， 也 就 是 选择 那个 我 们 推测 在 执行 
输入 /输出 操作 之 前 会 使 用 最 少 处 理 器 时 间 的 进程 。 于 是 ,我 们 就 会 把 那些 我 们 认为 将 会 耗 
费 较 多 处 理 器 时 间 的 进程 抛 在 后 边 。 从 这 个 角度 来 讲 ， 最 短 运行 时 间 优 先 调度 算法 是 优先 级 
调度 算法 的 一 个 变种 。 我 们 只 是 根据 我 们 推测 的 下 一 轮 处 理 器 集中 使 用 周期 的 长 度 来 设置 进 
程 的 优先 级 而 已 。 


8.4.5 高 响应 比 优先 调度 


高 响应 比 优 先 调度 ( Highest Response Ratio Next，HRRN) 类 似 于 最 短 作 业 优 先 调度 ， 
其 中 每 道 作业 的 优先 级 取决 于 其 估计 的 运行 时 间 。 但 是 ， 高 响应 比 优 先 调度 还 包含 了 进程 用 
于 等 待 的 时 间 。 如 果 一 个 进程 等 待 的 时 间 越 长 ， 则 该 进程 可 获得 更 高 的 优先 级 。 采 纳 这 种 改 
变 主要 是 为 了 减少 饥饿 问题 发 生 的 可 能 性 。 
优先 级 = (等 待 时 间 + 估计 运行 时 间 ) /估计 运行 时 间 


8.4.6 抢占 式 调度 

在 这 些 算 法 里 ， 我 们 均 假 设 当 一 个 进程 拥有 处 理 器 时 ， 只 要 它 想 运行 ,我 们 将 让 它 一 直 
运行 一 一 通常 它 会 因为 输入 /输出 操作 而 进入 等 待 状态 。 然 而 ， 如 果 我 们 正在 运行 优先 级 调 
度 算法 ， 并 且 当 前 运行 进程 的 优先 级 非常 低 ， 我 们 应 该 怎么 办 呢 ? 这 里 假设 另 一 个 具有 较 高 
优先 级 的 进程 一 直 在 等 待 某 输入 /输出 事件 且 该 事件 已 经 完成 。 婚 然 我 们 知道 这 个 进程 比 正 
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在 运行 的 进程 具有 更 高 的 优先 级 ， 所 以 我 们 可 以 把 正在 运行 的 进程 停 下 来 ， 并 启动 具有 更 高 
优先 级 的 进程 。 把 资源 从 一 个 进程 那里 夺 走 称 为 抢占 〈preemption )。 在 这 个 特例 中 ， 我 们 所 
抢占 的 资源 就 是 处 理 器 本 身 。 

我 们 可 以 把 这 种 抢占 的 理念 应 用 到 迄今 为 止 我 们 学 过 的 每 一 种 算法 里 。 在 大 多 数 情况 
下 ， 当 我 们 允许 抢占 时 ， 我 们 往往 会 给 相应 的 算法 起 一 个 新 的 名 字 。 举 例 来 说 ， 如 果 先 来 先 
服务 调度 算法 中 我 们 允许 实施 抢占 式 调度 ， 这 种 算法 就 可 以 称 为 轮转 式 〈round-robin) 调度 
算法 。 在 这 种 算法 里 ,抢占 并 不 是 根据 优先 级 ， 而 是 根据 时 间 额 度 。 我 们 允许 每 个 进程 在 不 
进行 任何 输入 /输出 操作 的 情况 下 运行 特定 的 时 间 长 度 。 如 果 当 前 进程 的 运行 已 经 用 完 指定 
的 时 间 长 度 ， 那 么 我 们 就 把 其 所 占用 的 处 理 器 抢夺 过 来 ， 调 度 和 运行 就 绪 队 列 的 队 首 进程 ， 
并 将 当前 进程 放 回 到 就 绪 队 列 的 末尾 。 

如 果 我 们 把 抢占 式 理念 用 到 最 短 运行 时 间 优 先 调度 算法 里 ,那么 该 算法 就 变 成 了 最 短 剩 
余 时 间 优 先 调度 算法 ( shortest remaining time first algorithm)。 当 我 们 因为 一 个 有 更 高 优先 
级 的 进程 而 把 处 理 器 从 当前 正在 运行 的 进程 那里 抢夺 过 来 时 ， 我 们 将 会 把 被 抢占 进程 的 根据 
估算 的 运行 时 间 而 计算 得 到 的 剩余 运行 时 间 记 录 到 其 进程 控制 块 中 。 于 是 ， 当 我 们 以 后 重新 
运行 该 进程 时 ， 就 无 须 重新 估算 其 运行 时 间 一 一 我 们 只 需要 使 用 当 该 进程 被 抢占 时 计算 得 到 
的 剩余 运行 时 间 就 可 以 了 。 

在 优先 级 调度 算法 里 ， 当 一 个 具有 较 高 优先 级 的 进程 转 和 人 就绪 状态 时 ， 我 们 也 可 以 采用 
抢占 式 调 度 。 我 们 并 没有 给 这 个 修改 后 的 算法 一 个 特殊 的 名 字 ， 只 是 简单 地 称 之 为 抢占 式 优 
先 级 (priority with preemption ) 调度 算法 。 


8.4.7 多 级 队列 调度 


现代 操作 系统 使 用 一 种 称 为 多 级 队列 ( multilevel queuing) 的 更 复杂 的 调度 算法 。 顾 名 
思 义 ， 在 这 种 算法 里 ， 我 们 将 使 用 多 个 队列 而 非 单个 队列 。 一 道 新 的 作业 将 会 被 放置 在 其 中 
的 某 个 队列 中 。 各 个 队列 可 以 全 部 使 用 相同 的 调度 算法 ， 也 可 以 使 用 不 同 的 算法 。 如 果 所 有 
算法 都 进行 时 间 分 片 ， 那 么 每 个 队列 可 以 分 别 拥 有 一 个 指定 的 不 同 的 时 间 额 度 (即时 间 片 大 
小 )。 这 些 队列 将 拥有 不 同 的 优先 级 ， 并 且 拥 有 最 高 优先 级 的 队列 会 首先 得 到 调度 服务 。 一 
个 必须 要 解决 的 问题 是 用 来 在 队列 之 间 共 享 处 理 器 的 机 制 ， 基 本 上 有 两 种 方法 。 第 一 种 方法 
是 ， 我 们 可 以 把 相关 机 制 实施 成 为 严格 的 优先 级 调度 机 制 。 也 就 是 说 ， 只 要 在 较 高 优先 级 队 
列 中 有 进程 ， 那 么 那些 进程 就 应 当 率 先 运 行 。 当 然 ， 采 用 这 种 机 制 ， 我 们 将 不 得 不 担心 饥 钱 
问题 。 另 一 种 方法 是 ， 在 队列 之 间 共 享 处 理 器 。 例 如 ， 我 们 可 能 将 处 理 器 时 间 的 50% 专门 
用 于 第 一 个 队列 (只 要 该 队列 中 有 作业 要 运行 )， 30% 专门 用 于 第 二 个 队列 ，20% 专门 用 于 
第 三 个 队列 。 这 样 ， 由 于 较 低 优先 级 的 队列 总 是 会 得 到 一 些 服务 ， 所 有 它们 将 不 会 被 俄 死 。 

大 多 数 现代 操作 系统 都 对 多 级 队列 调度 增加 了 一 种 反馈 ( feedback) 机 制 。 最 初 的 设想 
是 ， 把 任何 一 个 新 进程 都 看 作 是 交互 式 的 ， 因 此 会 把 它 放 到 一 个 高 优先 级 的 队列 里 。 如 果 相 
应 进程 在 运行 超过 此 队列 允许 时 间 片 大 小 的 过 程 中 没有 进行 过 任何 阻塞 性 操作 系统 调用 ， 那 
么 操作 系统 可 认为 它 并 不 真 的 是 一 个 交互 式 进程 ， 于 是 将 其 移 到 下 一 个 较 低 优先 级 的 队列 
里 。 这 个 低 优先 级 的 队列 也 可 能 拥有 较 长 的 时 间 片 大 小 。 需 要 提醒 的 是 ， 上 下 文 切 换 并 不 是 
生产 性 的 工作 ， 并 且 它 们 会 由 于 硬件 原因 而 使 进程 的 执行 速度 暂时 慢 下 来 ,我 们 将 在 后 面 对 
此 加 以 介绍 。 因 此 ， 如 果 进 程 在 高 优先 级 队列 的 时 间 片 内 没有 完成 ， 我 们 可 能 希望 在 较 低 优 
先 级 的 队列 赋予 它 更 长 的 时 间 ， 通常 有 至 少 三 个 这 样 的 队列 。 于 是 ， 如 果 一 个 进程 在 第 二 个 
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队列 的 时 间 片 内 仍然 没有 执行 任何 阻塞 性 调用 ， 它 会 被 移 到 更 低 优先 级 的 并 且 往 往 可 能 拥有 
更 大 的 时 间 片 的 队列 里 。 

当然 ， 所 有 的 进程 都 会 有 一 些 时 间 段 ， 它 们 在 这 些 时 间 段 内 会 比 在 其 他 时 间 段 做 更 多 
的 计算 。 因 此 ， 一 个 大 体 上 是 交互 式 的 进程 也 可 能 拥有 一 些 较 短 的 集中 完成 大 量 计算 的 时 间 
段 ， 故 而 被 下 沉 到 了 较 低 优先 级 的 队列 里 。 为 此 ， 我 们 希望 能 拥有 某 种 机 制 ， 允 许 一 个 进程 
回升 到 较 高 优先 级 的 队列 里 。 这 可 能 很 简单 ， 也 就 是 说 ， 每 当 发 现 一 个 进程 在 当前 级 别 队列 
的 时 间 片 未 用 完 的 情况 下 执行 了 一 个 阻塞 性 调用 ， 我 们 就 可 以 把 它 提升 到 一 个 较 高 优先 级 的 
队列 里 。 然 而 ， 这 可 能 有 点 反应 过 度 了 ， 所 以 我 们 可 能 会 发 现 ， 有 必要 等 到 一 个 进程 连续 多 
次 在 当前 级 别 队 列 的 时 间 片 内 执行 了 阻塞 性 调用 的 情况 下 ， 再 去 为 其 执行 队列 提升 操作 。 


8.4.8 最 佳 算法 的 选择 


有 这 人 么 多 的 算法 ， 我 们 该 如 何 比较 它们 呢 ? 用 来 比较 调度 算法 的 系统 性 能 指标 有 很 多 ， 
其 中 包括 : 

e 吞吐 量 一 一 每 小 时 或 每 分 钟 运行 的 作业 量 。 

e 平均 周转 时 间 一 一 作业 从 开始 到 结束 所 经 历 的 时 间 。 

e 平均 响应 时 间 一 一 从 提交 到 开始 输出 所 经 历 的 时 间 。 

e 处 理 器 利用 率 一 一 处 理 器 运行 实际 作业 的 时 间 百 分 比 (不 包括 进程 之 间 切 换 或 执行 

其 他 开销 ; 大 系统 对 此 更 感 兴趣 )。 

e 平均 等 待 时 间 一 一 进程 在 就 绪 队 列 中 所 花费 的 时 间 。 

前 三 项 取决 于 作业 行为 混合 情况 ( 译 者 注 : 主要 是 计算 与 输入 /输出 操作 的 混合 情况 )， 
因此 很 难 公平 和 准确 地 进行 比较 。 处 理 器 利用 率 往往 很 吸引 人 们 的 注意 力 ， 并 且 很 容易 测 
量 ， 但 在 个 人 计算 机 系统 中 ， 我 们 对 此 并 不 太 在 意 。 这 些 处 理 器 相当 便宜 ， 我 们 更 关心 最 优 
化 察觉 到 的 用 户 特性 。 平 均等 待 时 间 是 在 大 多 数 情况 下 最 有 意义 的 度量 指标 。 我 们 希望 确保 
大 部 分 的 计算 可 以 在 最 少量 的 时 间 浪 费 的 条 件 下 就 能 够 完成 。 平 均等 待 时 间 似 乎 最 精确 地 反 
映 了 这 一 点 。 

比较 各 种 算法 的 平均 等 待 时 间 的 最 简单 的 方法 是 使 用 所 谓 离散 建 模 ( discrete modeling) 
的 方法 。 我 们 挑选 进程 的 一 个 样本 集 以 及 它们 的 运行 时 间 ， 然 后 我 们 采用 手工 的 方式 来 模拟 
执行 该 样本 数据 的 各 个 进程 。 在 此 基础 上 ， 我 们 计算 那些 没有 运行 的 进程 的 等 待 时 间 ， 并 比 
较 相 应 结果 。 

首先 ， 考虑 下 表 的 这 一 组 进程 : 


进程 标识 符 到 达 时 间 








就 我 们 的 意图 而 言 ， 无 所 谓 采用 什么 样 的 时 间 单 位 ， 为 此 ,我们 在 这 里 不 妨 以 微 秒 作为 
单位 。 还 有 ， 请 注意 ,我 们 显示 了 进程 P2 和 P3 都 是 在 T2 时 刻 (这 里 即 2 微 秒 的 时 刻 ) 到 
er 4 有 一 个 处 理 器 的 情况 下 ， 这 两 个 进程 是 不 能 真正 在 T2 时 刻 一 起 到 达 的 ， 因 为 计 
算 机 一 次 只 能 做 一 件 事情 。 不 过 ， 我 们 的 时 钟 不 是 很 快 ， 所 以 ， 对 于 这 个 算法 来 说 ， 我 们 设 
eol het op ets lire eh 张 时 间 表 来 展示 在 处 理 器 上 
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运行 的 进程 。 对 于 这 组 数据 来 讲 ， 采 用 先 来 先 服务 调度 算法 ,我 们 将 会 看 到 下 面 的 时 间 表 : 


0 2 
| Pl | P2 | P3 | 


现在 ， 让 我 们 来 计算 平均 等 待 时 间 。 进 程 P1 在 T0 时刻 到 达 ， 因 此 它 立 即 开始 执行 。 
进程 P2 在 T2 时 刻 到 达 ， 但 是 其 并 没有 开始 运行 ， 而 是 等 到 T20 时 刻 当 进程 P1 完成 时 才 开 
始 执 行 ， 于 是 它 等 待 了 18 个 时 间 单 位 (这 里 即 18 微 秒 )。 进 程 P3 也 在 T2 时 刻 到 达 ， 但 同 
样 没有 开始 运行 ， 而 是 等 到 T22 时 刻 当 进程 P2 完成 时 才 开 始 执行 ， 于 是 它 等 待 了 20 个 时 
间 单 位 。 因 此 ， 平 均等 待 时 间 就 是 ( 0+18+20 ) /3=38/3=12.67。 

现在 假设 相同 的 三 个 进程 以 如 下 表 所 示 的 稍微 不 同 的 次 序 到 达 : 








相应 时 间 表 如 下 所 示 : 


Poi 1 P2 P3 1 
人 a 

这 一 次 是 两 个 短 的 进程 率先 到 达 ， 于 是 进程 P1 和 了 2 均 没有 等 待 ， 进程 P3 也 仅仅 等 待 
了 2 个 时 间 单 位 。 因 此 ,平均 等 待 时 间 是 ( 0+0+2 ) /3=2/3=0.67。 

到 达 时 间 的 这 一 很 小 的 差异 却 暴露 出 了 先 来 先 服务 调度 算法 的 一 个 主要 的 问题 ， 称 之 为 
结 队 效应 (convoy effect) 或 “ 队 首 阻塞 ” (head of line blocking ) 一 一 一 道 短 作业 紧 跟 着 一 道 
长 作业 之 后 到 达 的 话 将 不 得 不 等 待 好 长 时 间 才 能 开始 运行 。 这 将 会 使 运行 该 算法 的 系统 呈现 
出 平均 等 待 时 间 高 度 变化 的 特征 。 

让 我 们 再 次 来 看 一 下 第 一 组 数据 ， 但 这 次 我 们 将 为 到 达 的 作业 指定 优先 级 





最 小 的 数 


ET 





Me ee 


现在 ， 我 们 的 时 间 表 将 是 下 面 的 这 个 样子 : 


0 2 4 6 24 
1 P41 了 P31 P21Pl | 
| | |， sl 


在 这 种 情况 下 ， 进 程 Pl 立即 开始 执行 ， 不过， 在 T2 时 刻 ， 它 被 后 来 的 但 却 拥 有 最 高 
优先 级 的 进程 P3 抢占 了 处 理 器 ， 于 是 进程 P3 立即 开始 执行 。 相 应 地 ， 进 程 P2 必须 得 等 待 
2 个 时 间 单 位 即 T4 时 刻 才 可 开始 运行 ， 然 后 进程 P1 在 等 待 4 个 时 间 单 位 之 后 在 T6 时 刻 再 
次 启动 运行 。 因 此 ， 平 均等 待 时 间 应 当 是 (4+2+0 ) /3=2。 

这 个 结果 没有 像 当 该 组 进程 恰好 以 最 优 次 序 到 达 情 况 下 的 先 来 先 服务 调度 算法 那么 好 ， 
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但 却 肯定 比 当 该 组 进程 以 不 好 的 次 序 到 达 情 况 下 的 先 来 先 服务 调度 算法 要 好 些 。 在 这 个 示例 
中 ， 较 低 优先 级 的 作业 刚好 是 最 长 的 作业 。 当 我 们 运行 最 短 运 行 时 间 优先 调度 算法 时 ， 具 有 
最 短 估计 运行 时 间 的 进程 应 获得 最 高 的 优先 级 。 为 此 ， 这 也 正 是 在 最 短 运行 时 间 优 先 调度 算 
法 中 所 发 生 的 过 程 ， 所 以 ， 这 个 模拟 过 程 也 适用 于 那 种 特定 类 型 的 优先 级 调度 算法 。 

接 下 来 ， 让 我 们 来 看 看 最 短 运 行 时 间 优先 调度 算法 的 另外 一 个 例子 。 假 设 我 们 有 如 下 的 
一 组 进程 ， 并 且 我 们 不 允许 抢占 处 理 器 : 


进程 标识 符 达 了 时 运行 时 间 





那么 ， 对 应 的 时 间 表 将 会 是 如 下 这 个 样子 : 


0 vA 15 19 
| Pp1 | P| P4 | P2 | 
[a | 
而 我 们 的 平均 等 待 时 间 应 当 为 (0+13+9+9 ) /4=7.75。 
如 果 现 在 假设 我 们 允许 抢占 处 理 器 ， 则 我 们 的 时 间 表 应 当 是 下 面 这 个 样子 : 





6 9 19 
| pl 1PONPSL PA PS 一作 | 
| Ea. | | | 


请 注意 ， 当 前 情况 下 这 些 进程 本 身 的 总 的 执行 时 间 和 没有 抢占 的 情况 下 的 总 的 执行 时 间 
是 相同 的 。 但 是 ， 现 在 的 平均 等 待 时 间 却 是 (7+3+0+0 ) /4=2.5。 

显然 ， 我 们 更 希望 这 个 结果 一 一 但 代价 是 什么 呢 ? 我 们 知道 ， 任 何事 情 都 是 有 代价 的 。 
研究 一 下 没有 抢占 式 调度 的 情况 ， 可 以 发 现 我 们 仅仅 做 了 3 次 上 下 文 切 换 ， 而 在 抢占 式 调度 
的 情况 下 ， 我 们 则 做 了 $ 次 上 下 文 切换 。 我 们 应 该 还 记得 ， 完 成 上 下 文 切换 所 花费 的 时 间 并 
不 是 系统 从 事 生 产 性 工作 的 时 间 。 也 就 是 说 ， 这 些 均 属 于 我 们 花费 在 使 平均 等 待 时 间 更 小 
(从 而 使 许多 事情 ， 特 别 是 高 优先 级 的 事情 ， 看 起 来 发 生得 更 快 些 ) 的 管理 方面 的 开销 。 后 
面 我 们 将 会 看 到 ， 上 下 文 切换 的 开销 甚至 比 只 是 用 来 保存 和 恢复 进程 处 理 器 状态 所 花费 的 时 
间 以 及 我 们 运行 所 选调 度 算法 上 所 花费 的 时 间 还 要 大 。 此 外 ， 上 下 文 切换 还 会 在 一 个 较 短 的 
时 间 段 内 降低 硬件 速度 一 一 在 某 些 情况 下 会 使 其 急剧 下 降 。 因 此 ， 我 们 希望 执行 尽 可 能 少 的 
上 下 文 切 换 。 换 名 话说 ， 我 们 必须 要 认真 考虑 平均 等 待 时 间 的 典型 下 降 与 上 下 文 切换 开销 
(硬件 系统 相关 ) 以 及 由 此 导致 的 进程 减速 之 间 的 平衡 。 


8.4.9 ”长 程 调 度 器 


一 些 操作 系统 还 包含 有 所 谓 长 程 调 度 器 ( long-term scheduler) 的 另外 一 个 调度 程序 模 
块 。 在 拥有 图 形 化 用 户 界面 的 个 人 计算 机 操作 系统 中 ， 通 常 并 不 存在 这 样 的 调度 器 。 当 用 户 
点 击 一 个 图 标 时 ， 与 该 图 标 相关 联 的 进程 便 开始 运行 。 在 (可 能 除了 交互 式 处 理 之 外 还 ) 具 
有 面向 批 处 理 的 作业 流 的 大 型 计算 机 系统 中 ， 系 统 并 不 会 自动 启动 执行 所 有 提交 的 作业 。 被 
提交 的 作业 首先 被 放 到 了 一 个 队列 里 ， 稍 后 才 会 开始 执行 。 这 就 是 长 程 调度 器 的 工作 任务 ， 
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即 决 定 有 多 少 道 作业 尝试 同时 执行 以 及 具体 哪些 作业 什么 时 候 运 行 。 这 项 决定 的 前 一 个 方面 
是 指 ， 应 当 就 我 们 希望 同时 运行 的 作业 限定 一 个 最 少 的 道 数 即 下 限 。 也 就 是 说 ,假如 系统 中 
要 运行 的 作业 比 我 们 能 同时 运行 的 作业 量 还 多 ,我 们 将 会 开始 执行 至 少 下 限 这 么 多 道 的 作 
业 。 这 项 决定 的 后 一 个 方面 将 和 处 理 器 利用 率 的 水 平 有 关 。 如 果 所 有 正在 运行 的 作业 大 部 分 
是 那些 频繁 使 用 输入 /输出 操作 的 作业 ， 长 程 调度 器 将 会 尝试 去 寻找 一 些 它 认为 会 提高 处 理 
器 利用 率 的 作业 。 在 某 种 程度 上 ， 相 关 信息 可 以 通过 与 作业 一 起 提交 的 记 账 信息 反映 出 来 。 
而 在 其 他 情况 下 ， 调 度 器 将 会 只 是 选择 一 道 作业 而 已 ， 可 能 是 在 先 来 先 服务 调度 的 基础 上 。 
在 第 11 章 中 ,我 们 将 讨论 当 内 存 变 得 非常 拥挤 的 时 候 这 种 方法 可 能 导致 的 一 个 问题 。 长 程 
调度 器 可 以 使 用 除了 先 来 先 服务 调度 算法 以 外 的 大 多 数 的 短程 调度 算法 。 鉴 于 长 程 调度 器 对 
于 启动 的 每 个 进程 只 运行 一 次 ， 所 以 它 不 需要 非常 迅捷 ， 并 且 可 以 花费 较 多 的 资源 来 精心 地 
选择 下 一 道 作 业 。 


8.4.10 ”处 理 器 亲 和 性 


我 们 已 多 次 提 到 ， 当 一 个 处 理 器 从 一 个 进程 切换 到 另 一 个 进程 时 ， 会 牵涉 相当 大 的 开 
销 。 由 于 硬件 正在 进行 的 内 存 高 速 缓存 ， 新 进程 的 执行 将 在 某 个 时 间 段 内 显著 慢 下 来 ， 直 到 
高 速 缓存 的 内 容 从 旧 的 进程 切换 为 新 的 进程 。 进 一 步 说 ,我 们 在 一 个 系统 中 可 能 会 有 一 些 我 
们 认为 比 其 他 进程 更 为 重要 的 进程 。 例 如 ， 我 们 的 系统 可 能 建立 起 来 是 要 作为 专用 的 数据 库 
服务 器 ， 于 是 我 们 可 能 希望 数据 库 程 序 具 有 最 高 的 优先 级 。 因 此 ， 在 多 处 理 器 系统 中 ， 操 作 
系统 通常 可 能 会 对 给 定 的 进程 维持 一 项 所 谓 的 处 理 器 亲 和 性 ( processor affinity)。 这 里 的 亲 
和 性 是 指 操作 系统 将 会 用 来 表示 对 应 进程 在 每 当 可 能 运行 的 情况 下 在 某 个 特定 处 理 器 上 运行 
的 偏好 的 取 值 。 在 一 些 情况 下 ， 系 统管 理 员 可 以 指示 一 个 特定 的 进程 应 当 紧 密 耦 合 到 一 个 特 
定 的 处 理 器 上 。 而 在 其 他 情况 下 ， 操 作 系 统 将 仅仅 尝试 让 一 个 进程 运行 在 其 上 次 运行 的 同一 
处 理 器 上 。 在 某 些 操 作 系 统 中 ， 也 可 能 让 一 个 处 理 器 专门 服务 于 一 个 进程 ， 这 样 就 只 有 那个 
进程 会 运行 在 那个 处 理 器 上 。 


8.5 进程 创建 

当 一 个 用 户 向 命令 解释 器 发 送信 号 以 启动 一 个 新 的 进程 时 ， 应 当 有 一 个 方法 能 够 让 那个 
命令 解释 器 进程 启动 执行 该 用 户 的 相应 进程 。 一 般 而 言 ， 命 令 解释 器 会 使 用 一 条 标准 的 访 管 
调用 〈 supervisor call) 来 启动 另 一 个 进程 ， 该 访 管 调用 称 为 fork。 执 行 相应 调用 的 进程 称 为 
父 进程 《parent process)， 而 作为 结果 被 启动 的 进程 称 为 子 进程 (child process)。 整 套 机 制 被 
称 为 “创建 (forking) 一 个 子 进 程 ”， 有 时 也 被 称 为 “产生 (spawning) 一 个 子 进程 ”。 为 此 ， 
命令 解释 器 显然 需要 能 够 启动 另 一 个 进程 ， 但 为 什么 一 个 用 户 程 序 需 要 这 样 做 呢 ? 第 一 个 理 
由 是 出 于 性 能 的 考虑 。 如 果 一 个 进程 拥有 许多 要 做 的 任务 可 以 同时 启动 ,那么 它 就 可 以 启动 
其 他 的 进程 来 执行 其 中 的 某 些 任务 ， 并 且 操作 系统 可 以 保持 所 有 的 进程 都 同时 运行 ， 尤 其 当 
系统 拥有 多 个 处 理 器 时 更 是 如 此 。 关 于 为 什么 一 个 应 用 程序 可 能 会 被 分 化 成 若干 个 进程 ， 还 
有 其 他 的 一 些 理由 ， 我 们 将 会 就 此 在 下 一 章 中 展开 进一步 的 讨论 。 

然而 ， 当 我 们 让 一 个 进程 去 启动 另 一 个 进程 时 ， 会 产生 若干 问题 。 首 先 ， 如 果 父 进程 
由 于 任何 原因 而 终止 ， 那 么 我 们 是 让 各 个 子 进程 继续 运行 呢 ， 还 是 让 它们 也 终止 呢 ? 大 多 数 
的 操作 系统 在 父 进程 终止 的 情况 下 ， 将 会 自动 终止 其 各 个 子 进程 。 当 然 也 有 一 些 操 作 系统 例 
外 。 在 大 多 数 的 现代 操作 系统 中 ， 我 们 可 以 有 自己 的 选择 。 相 应 父 进程 已 经 终止 的 子 进 程 称 
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为 孤儿 进程 (orphan process)。 

另 一 个 问题 与 资源 的 所 有 权 有 关 。 如 果 一 个 父 进程 拥有 一 个 打开 的 文件 ， 那 么 其 子 进程 
是 否 可 以 访问 该 文件 ? 另 一 个 问题 则 是 与 在 子 进 程 中 所 运行 的 程序 有 关 。 在 fork 调用 的 大 
多 数 情况 下 ， 子 进程 是 其 父 进程 在 另 一 片 内 存 块 区 中 的 完整 的 副本 。 请 注意 ， 父 进程 和 子 进 
程 都 将 在 fork 调用 之 后 继续 执行 指令 。 一 个 很 有 意思 的 问题 是 ， 每 个 进程 如 何 知道 哪个 实 
例 是 其 父 进程 ， 而 哪个 实例 是 其 子 进程 ”通常 情况 下 ， 就 fork 调用 的 返回 值 而 言 ， 其 对 子 
进程 将 被 设置 为 零 ， 而 对 父 进 程 则 设置 为 正 的 非 零 数 ( 即 子 进程 的 标识 符 )。 以 下 代码 是 典 
型 的 fork 系统 调用 的 一 个 例子 : 

int main(void) { 

pid t pid = fork()? 


if (pid == 0) {/* 如 果 pid=0， 那 么 我 们 在 子 进程 中 。*/ 
do something(from the_child); 


exit(0); 

} 

else if (pid > 0){/* 如 果 pid 为 正 数 ， 那 么 我 们 在 父 进程 中 ， 且 pid 
为 其 子 进 程 的 标识 符 。*/ 

do_something_ else(from the parent); 


} 
exit(0); 


else {/* 如 果 pid 为 负数 ,那么 出 现 了 错误 ; 例如 ， 正 在 运行 的 进程 数 达 
到 了 最 大 值 。*/ 
fprintf(stderr, “Can’t fork, error %d\n’”, errno); 
exit(1); 
} 
} 
通常 情况 下 ， 让 父 进程 的 另外 一 个 实例 运行 并 不 是 我 们 真正 希望 的 事情 。 命 令 解释 器 显 
然 属于 这 种 情况 ， 我 们 并 不 想 要 另 一 个 命令 解释 器 的 副本 。 我 们 希望 它 去 运行 某 个 其 他 的 程 
序 。 一 般 而 言 ， 我 们 真正 想 要 的 是 在 一 个 子 进程 中 来 运行 男 一 个 程序 。 因 此 ,在 fork 调用 
之 后 ， 应 执行 男 一 个 调用 来 把 一 个 新 的 程序 加 载 到 为 子 进程 分 配 的 存储 器 空间 中 ， 这 通常 是 
一 个 exec 系统 调用 。 
当然 ， 如 果 我 们 真正 想 要 的 是 让 另 一 个 程序 来 运行 ， 那 么 将 父 进程 复制 到 另 一 片 内 存 块 
区 的 最 初 的 步骤 是 对 许多 资源 的 浪费 。 为 此 ， 一 些 操作 系统 提供 了 一 条 称 为 shell 命令 (或 
称 为 外 壳 程 序 命令 ) 的 不 同调 用 。 这 条 命令 将 会 创建 一 个 新 进程 ， 但 不 会 将 父 进程 复制 到 子 
进程 空间 一 一 它 会 立即 加 载 所 期 望 的 程序 。 一 些 操作 系统 既 提 供 了 fork/exec 调用 ， 又 提供 
了 shell 命令 ， 而 其 他 的 操作 系统 则 仅仅 提供 了 前 者 或 后 者 中 的 一 个 。 在 一 些 系统 中 ， 高 级 
语言 库 将 提供 一 条 shell 命令 ， 但 是 如 果 操 作 系统 没有 相应 的 函数 调用 ， 则 对 应 库 有 可 能 必 
须 得 使 用 fork/exec 序列 来 完成 相关 工作 。 
最 后 一 个 问题 与 子 进程 运行 时 的 父 进程 的 行动 有 关 。 类 似 于 输入 /输出 的 处 理 方式 ， 即 
可 以 是 同步 的 ， 也 可 以 是 异步 的 。 当 一 个 父 进程 创建 一 个 子 进程 时 ， 它 可 以 选择 继续 执行 其 
自身 ， 即 与 子 进程 并 行 执行 ， 或 者 它 也 可 以 选择 等 待 ， 直 到 子 进程 完成 后 再 继续 执行 。 当 
然 ， 也 有 可 能 父 进程 最 初 选择 了 继续 执行 ， 但 后 来 需要 等 待 直到 子 进 程 完成 相应 工作 。 为 
此 ， 通 常会 有 一 个 单独 的 wait 系统 调用 ， 通 过 该 系统 调用 ， 一 个 进程 可 以 使 自身 进入 等 待 
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状态 ， 直 到 子 进程 完成 。 


8.6 ”线程 角 坟 内存 


8.6.1 什么 是 线程 

假设 我 们 把 一 个 进程 的 逻辑 地 址 空间 作为 一 张 图 表 上 
的 纵 轴 。 伴 随时 间 的 推移 我 们 不 断 地 每 隔 一 段 时 间 就 向 
右 移动 ， 并 把 指令 计数 器 在 该 时 间 段 到 达 的 每 一 个 地 方 做 
一 个 标记 。 于 是 ， 我 们 最 后 可 能 就 会 得 到 类 似 于 图 8-3 那 
样 的 东西 。 我 们 可 以 想象 ， 我 们 摊 开 一 根 线 ， 并 把 它 摆 放 
在 图 表 上 ， 而 不 是 用 铅笔 来 标记 空间 。 这 是 一 个 类 比 ， 由 
此 便 产生 了 短语 “执行 的 线程 ”(thread of execution ) 。 

现在 ， 假 设 我 们 停止 了 这 个 进程 ， 并 将 代表 处 理 器 的 
状态 的 所 有 数据 保存 到 一 张 表 中 (我 们 可 能 称 之 为 线程 控 
制 块 (Thread Control Block，TCB))。 然 后 ， 进 一 步 假设 
我 们 从 头 开始 执行 这 个 进程 。 我 们 再 次 让 它 运行 一 段 时 间 ， 然 后 让 它 停 下 来 ， 并 将 处 理 器 
的 状态 保存 在 另 一 个 线程 控制 块 中 。 我 们 现在 可 以 返回 去 ， 恢 复 所 保存 的 对 应 于 第 一 个 线程 
的 处 理 器 状态 ， 并 继续 执行 第 一 个 线程 。 这 与 运行 多 个 进程 有 什么 区 别 呢 ? 使 用 多 线程 可 能 
在 多 个 方面 都 比 使 用 多 进程 要 好 些 。 首 先 ， 我 们 在 内 存 中 只 有 一 份 程序 和 数据 ， 所 以 我 们 会 
有 更 多 的 内 存 空 间 用 来 存储 其 他 东西 。 另 一 方面 ， 在 线程 之 间 切 换 的 开销 比 在 进程 之 间 切 换 
的 开销 要 小 得 多 ， 因 为 我 们 只 保存 处 理 器 状态 。 通 常情 况 下 ， 这 意味 着 仅仅 保存 几 个 寄存 器 
(包括 指令 指针 ) 和 指向 栈 空间 的 指针 。 在 某 些 计算 机 上 ， 这 可 以 用 单一 的 一 条 指令 就 可 以 
完成 。 我 们 没有 保存 记 账 数据 、 操 作 系 统 调度 信息 、 执 行 统计 信息 等 。 此 外 ， 正 如 我 们 前 面 
所 讨论 的 ， 当 我 们 在 一 个 进程 和 另 一 个 进程 之 间 切 换 处 理 器 的 时 候 ， 往 往 会 出 现 硬件 性 能 问 
题 。 我 们 希望 尽 可 能 避免 进程 上 下 文 切换 所 造成 的 大 量 开销 。 

最 后 ， 当 使 用 多 个 进程 来 实现 一 个 系统 的 时 候 ， 这 些 进程 是 很 难 进行 通信 的 。 这 是 很 自 
然 的 。 操 作 系统 设计 人 员 克 服 重重 困难 和 做 了 大 量 的 努力 ， 才 使 得 进程 彼此 隔离 开 来 ， 从 而 
使 一 个 进程 不 能 有 意 或 无 意 地 改变 另 一 进程 的 内 存 的 内 容 。 于 是 ， 许 多 不 同 的 机 制 被 创造 出 
来 以 支持 协作 式 进 程 之 间 的 通信 。 我 们 在 下 一 章 中 将 会 介绍 其 中 的 几 种 机 制 。 然 而 ， 线 程 是 
没有 这 类 问题 的 。 根 据 定义 ， 由 一 个 进程 所 创建 的 所 有 线程 都 在 同一 个 地 址 空间 中 运行 ， 并 
共享 相应 的 代码 和 数据 。 因 此 ， 线 程 间 通信 是 鸡毛 蒜 皮 的 小 事 一 所 有 线程 只 需 访 问 相 同 的 
变量 即 可 。 主 要 的 困难 则 在 于 防止 各 个 线程 同时 操作 相同 的 数据 。 这 个 问题 将 在 下 一 章 中 进 
行 深入 讨论 。 

实际 上 ， 当 我 们 开始 执行 第 二 个 线程 的 时 候 ， 我 们 并 不 是 真 的 在 进程 的 一 开始 就 启动 
它 。 回 想 一 下 ,我 们 只 是 说 过 ， 各 个 线程 共享 一 份 程序 代码 及 对 应 进程 所 拥有 的 数据 。 正 常 
情况 下 ， 一 个 进程 所 做 的 首要 事情 之 一 就 是 初始 化 数据 表 。 由 于 第 一 个 线程 已 经 完成 了 这 项 
设置 ， 所 以 我 们 不 会 想 让 第 二 个 线程 重 做 这 件 事情 。 更 重要 的 是 ,第 二 个 线程 的 启动 不 是 由 
操作 系统 自己 完成 的 。 它 是 由 正在 运行 的 进程 启动 的 ， 这 样 就 可 以 让 系统 代表 进程 完成 更 多 
的 工作 ， 同 时 还 避免 了 完整 的 进程 上 下 文 切换 及 由 此 产生 的 大 量 开 销 。 也 正 是 出 于 这 个 原 
因 ,， 线程 有 时 被 称 为 轻 量 级 进程 ( lightweight process)。 当 一 个 进程 正在 运行 时 ， 它 将 会 到 
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达 某 个 位 置 ， 这 里 有 一 些 其 他 额外 的 工作 可 以 与 主线 程 (main thread) 正在 进行 的 工作 并 行 
完成 ， 因 此 进程 ( 父 线程 ) 将 会 启动 一 个 子 线程 来 
完成 这 项 额外 的 工作 。 在 图 8-4 中， 我 们 可 以 看 
到 关于 一 个 进程 及 其 两 个 线程 的 一 个 例子 。 第 一 
个 线程 显示 为 实 线 。 在 某 个 时 候 ， 第 一 个 线程 调 
用 操作 系统 启动 第 二 个 线程 ， 在 图 中 表示 为 虚线 。 
最 终 ， 操 作 系统 再 次 切换 回 第 一 个 线程 。 这 两 次 
切换 都 是 在 没有 进程 间 上 下 文 切换 开销 的 情况 下 
完成 的 。 如 果 系 统 拥有 多 个 处 理 器 或 一 个 处 理 器 
能 够 同时 运行 多 个 线程 ， 那 么 这 两 个 线程 就 可 以 
真正 地 同时 运行 。 

我 们 可 以 在 字 处 理 程序 中 看 到 关于 线程 如 何 
工作 的 一 个 示例 。 由 于 这 是 正在 写 人 ， 检 查 结果 
表明 ， 字 处 理 程序 拥有 18 个 运行 的 线程 。 有 些 是 
相当 明显 的 , 但 要 想 出 18 个 来 却 并 非 易 事 : 图 8-4 ”一 个 进程 中 共享 所 有 代码 和 

® 前 台 按 键 处 理 数据 的 多 个 线程 

e 显示 更 新 

e 拼写 检查 器 

。 语法 检查 器 

。 重新 分 页 

。“ 智 能 标签 ”识别 

。 定期 保存 文件 

另 一 个 例子 则 可 以 在 诸如 万 维 网 服务 器 的 服务 器 应 用 程序 中 经 常见 到 。 一 个 线程 即将 等 
待 传人 的 HTTP 请 求 。 对 于 每 个 传人 的 请 求 ， 都 将 启动 一 个 新 的 线程 ， 相 应 线程 通常 会 执行 
(至 少 这 些 ) 步骤 : 

。 解析 传人 请 求 

。 查找 所 请 求 的 文件 

。 读 取 页 面 

e 格式 化 页 面 以 方便 输出 

。 请 求 传输 页 面 

。 结束 退出 

这 个 序列 将 每 个 请 求 的 处 理 保持 在 单独 的 执行 线程 中 ， 并 且 使 得 程序 逻辑 比 起 采用 单一 
进程 记录 跟踪 数 百 甚至 数 千 个 单独 请 求 的 状态 要 简单 得 多 。 


8.6.2 ”用 户 级 线程 与 内 核 级 线程 


从 历史 上 看 ， 多 进程 的 使 用 出 现在 线程 的 想法 之 前 。 当 程序 设计 人 员 意 识 到 在 进程 之 间 
的 切换 使 用 了 如 此 多 的 资源 并 使 执行 速度 下 降 得 如 此 厉害 的 时 候 ， 他 们 开始 建立 起 线程 的 概 
念 。 然 而 ， 当 时 的 操作 系统 还 没有 内 置 的 线程 支持 机 制 。 因 此 ， 最 初 的 线程 的 开发 是 作为 一 
组 子 程序 库 例 程 而 完成 的 。 当 然 ， 这 意味 着 整个 线程 软件 包 是 运行 在 用 户 模式 下 的 ， 而 操作 
系统 并 不 知道 应 用 程序 正在 试图 保持 多 个 活动 的 并 行 执行 。 因 而 ， 如 果 一 个 进程 中 的 任何 一 
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个 线程 执行 了 将 会 由 于 某 种 原因 而 阻塞 的 系统 调用 时 ， 那 么 整个 应 用 程序 及 其 所 有 的 线程 都 
将 同时 被 阻塞 。 这样 的 线程 软件 包 被 称 为 用 户 级 线程 ( user-level thread) 软件 包 ， 因 为 它 是 
完全 运行 在 用 户 模式 下 的 。 也 正 因 如 此 ， 针 对 使 用 这 种 用 户 线程 库 的 程序 设计 必须 非常 小 心 
谨慎， 从 而 防止 因 一 个 线程 而 引发 整个 进程 的 睡眠 。 

尽管 如 此 ， 操 作 系 统 的 设计 人 员 终 于 做 出 决定 : 线程 的 想法 非常 好 ， 他 们 应 当 把 线程 也 
数 合 并 到 内 核 中 。 为 此 ， 关 于 应 用 程序 对 线程 的 使 用 ， 现 在 的 操作 系统 是 可 以 察觉 到 的 。 在 
许多 情况 下 ， 如 果 单 个 线程 对 操作 系统 进行 了 阻塞 性 调用 ， 那 么 操作 系统 并 不 需要 阻塞 整个 
进程 。 这 样 的 线程 软件 包 称 为 内 核 级 线程 (kernel-level thread)。 此 外 ， 由 于 操作 系统 知道 各 
个 线程 的 存在 ， 所 以 在 多 处 理 器 系统 中 ， 就 可 能 让 线程 分 别 在 独立 的 处 理 器 上 运行 了 。 这 是 
内 核 级 线程 的 一 项 主要 优势 ， 尤 其 是 在 进入 多 核 处 理 器 系统 时 代 背 景 一 一 多 核 处 理 器 系统 将 
很 快 成 为 普通 工作 站 的 标准 配置 ， 而 不 是 只 有 在 强大 的 服务 器 上 才能 发 现 的 新 鲜 玩意 一 一 的 
情况 下 。 

一 般 来 说 ， 因 为 程序 员 不 必 想 方 设法 去 避免 阻塞 性 调用 ， 所 以 内 核 线程 比 用 户 线 程 更 容 
易 使 用 ， 这 也 使 得 其 编程 模型 更 加 简单 方便 。 例 如 ， 考 虑 使 用 线程 来 编写 一 个 万 维 网 服务 程 
序 。 这 类 应 用 程序 往往 会 采用 一 个 循环 ， 并 在 其 中 等 待 自 网 络 传人 的 HTTP 请 求 命令 。 当 
一 个 请 求 传人 和 要 求 返回 一 个 页 面 时 ， 主 应 用 程序 线程 便 启 动 一 个 单独 的 线程 来 处 理 这 项 请 
求 ， 然 后 返回 去 继续 等 待 更 多 的 请 求 。 这 样 ， 正 如 我 们 前 面 所 勾勒 出 来 的 ， 子 线程 便 接受 了 
一 项 非常 简单 的 任务 。 进 一 步 说 ， 它 首先 会 解析 HTTP 请 求 ， 然 后 在 磁盘 上 查找 对 应 页 面 ， 
并 通过 一 系列 读 操作 把 对 应 页 面 读 取 进 来 ， 接 下 来 再 把 页 面 格 式 化 为 HTTP 消息 ， 并 把 结 
果 发 送出 去 (假设 找到 对 应 页 面 的 前 提 条 件 下 )， 最 后 结束 退出 。 这 样 就 无 须 被 设计 成 同时 
处 理 多 个 请 求 ， 从 而 使 得 每 个 线程 的 设计 直截了当 和 非常 简单 。 另 外 一 种 方法 是 让 主 应 用 程 
序 为 每 个 输入 /输出 操作 发 出 异步 调用 。 尽 管 这 确定 无 疑 是 可 能 的 ， 但 是 相应 模型 要 复杂 许 
多 ， 并 且 很 难 利 用 多 处 理 器 系统 的 优势 。 

后 来 还 开发 了 另外 的 一 种 用 户 级 线程 软件 包 ， 其 设计 没有 依赖 内 核 级 线程 的 支持 ， 但 却 
提供 了 在 内 核 级 线程 中 可 以 获得 的 编程 简单 性 的 某 些 优点 。 此 软件 包 称 为 绿色 线程 〈green 
thread)。 绿 色 线 程 库 捕 获 阻塞 性 系统 调用 ， 并 将 其 转换 为 非 阻塞 性 调用 ， 在 此 基础 上 ， 它 
们 处 理 各 种 用 户 线程 的 调度 。 这 一 模型 允许 一 个 程序 无 须 修 改 就 可 运行 在 加 载 有 内 核 级 线程 
库 的 模式 下 ， 或 者 加 载 有 绿色 用 户 线 程 库 的 模式 下 。 不 过 ， 这 种 方法 还 是 有 一 些 缺 点 的 。 首 
先 ， 如 果 系 统 是 多 处 理 器 系统 ， 那 么 各 个 线程 将 无 法 利用 到 多 处 理 器 的 优势 ， 因 为 内 核 并 不 
知道 它们 的 存在 。 而 正如 我 们 已 经 提 到 的 ， 处 理 器 的 发 展 趋势 是 大 多 数 系统 已 经 包含 有 多 个 
处 理 器 。 其 次 ， 内 核 级 线程 可 以 采用 抢占 式 调度 方式 ， 因 此 一 个 耗费 太 长 时 间 来 完成 其 任务 
的 线程 不 可 能 支配 整个 系统 ， 但 绿色 线程 并 没有 提供 这 种 级 别 的 控制 。 


8.6.3 ”线程 支持 模型 


当 操 作 系统 开始 提供 内 核 线程 包 时 ， 应 用 程序 设计 人 员 并 没有 表现 出 为 了 使 用 内 核 线 
程 而 重 写 他 们 的 应 用 程序 的 迫切 希望 。 鉴 于 此 ， 操 作 系 统 设计 人 员 获 取 到 了 现 有 的 用 户 线程 
库 ， 并 对 它们 进行 了 重 写 ， 以 使 这 些 用 户 线程 库 可 以 利用 内 核 线 程 提供 的 相关 机 制 。 一 般 来 
说 ， 有 三 种 常见 的 方法 可 用 于 用 户 库 例 程 对 内 核 线程 机 制 的 使 用 ， 而 区 分 它们 的 关键 在 于 将 
用 户 线程 映射 到 内 核 线程 的 方式 。 这 三 种 方法 具体 为 一 对 一 映射 模型 、 多 对 一 映射 模型 和 多 
对 多 映射 模型 。 一 对 一 映射 相当 简单 。 具 体 而 言 ， 当 应 用 程序 调用 库 例 程 来 创建 一 个 新 的 
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线程 时 ， 库 例 程 就 调用 内 核 线程 机 制 来 创建 一 个 新 的 内 核 线程 。 图 8-5 给 出 了 一 对 一 线程 映 
射 模型 的 原理 示意 图 。 这 种 模型 具有 开发 快捷 简单 、 方 便 用 ; 

户 理解 的 优点 。 虽 然 其 他 模型 似乎 赋予 了 用 户 更 多 的 控制 权 ， 
但 那些 模型 使 用 起 来 非常 复杂 ， 故 而 非常 容易 出 错 。 大 多 数 |， E 
操作 系统 的 供应 商 正在 摆脱 比较 复杂 的 模型 ， 其 理由 是 细 粒 
度 精确 控制 的 弊端 远 甚 于 其 有 利 的 方面 。 


第 二 种 映射 模型 称 为 多 对 一 映射 模型 。 回 想 一 下 ， 当 应 | 内核 内 核 内 核 
用 程序 中 的 任何 一 个 线程 对 操作 系统 执行 了 阻塞 性 调用 时 ， | 线程 | | 线程 2 | | 线程 3 
正在 被 修改 的 用 户 库 是 会 阻塞 整个 进程 的 。 在 这 种 情况 下 ， 图 8.5 对 线程 映射 模型 


多 对 一 映射 模型 将 会 做 出 完全 相同 的 事情 。 因 为 仅仅 创建 了 
一 个 内 核 线程 ， 所 以 所 有 的 用 户 线程 都 将 映射 到 这 同一 个 内 


核 线程 上 。 图 8-6 给 出 了 多 对 一 线程 映射 模型 的 原理 示意 图 。 | 3 WW 
与 一 对 一 线程 映射 模型 相 比 ， 这 种 模型 效果 差强人意 ， | 图 上 
因为 它 没有 提供 内 核 线程 的 优势 。 它 只 有 在 操作 系统 没有 支 
持 内 核 线程 的 时 候 才 会 使 用 。 在 这 种 情况 下 ， 唯 一 的 “内 核 
线程 ”就 是 正在 运行 的 进程 本 身 。 
最 后 一 种 模型 称 为 多 对 多 映射 模型 。 在 这 种 模型 里 ， 程 s: 
序 设计 人 员 将 会 告知 系统 关于 需要 多 少 用 户 线程 、 多 少 内 核 ”图 8-6 “多 对 一 线程 映射 模型 
线程 以 及 如 何 映射 它们 的 一 些 信 息 。 其 基本 想法 是 ， 拥 有 一 
组 可 用 的 内 核 线程 ， 并 在 需要 时 可 以 为 它们 动态 地 分 配 用 户 


线程 。 当 然 ， 也 可 能 是 拥有 多 组 用 户 线程 和 内 核 线程 ， 并 指 局 ey et 
定 某 些 用 户 线程 绑 定 到 一 个 内 核 线程 上 。 图 8-7 举例 说 明了 局 ey et 


多 对 多 线程 映射 模型 。 正 如 前 面 所 提 到 的 ， 这 种 模型 在 理论 


ny 


上 使 用 户 可 以 对 整个 系统 的 行为 实施 细 粒 度 的 精确 控制 ， 但 pe i ~ 
是 这 种 模型 却 很 难 实现 正确 的 使 用 ， 所 以 正 渐渐 丧失 吸引 力 。 
特别 地 ， 现 代 系 统 已 经 拥有 了 非常 庞大 的 内 存 空间 和 非常 高 | 线程! | | 线程 2 
速 的 处 理 能 力 ， 这 样 便 使 得 用 户 通过 采用 此 类 复杂 模型 能 够 
获取 到 的 可 感知 的 性 能 增益 变 得 微乎其微 ， 因 而 犯 不 上 为 此 
去 遭受 由 此 带 来 的 程序 设计 难题 。 

虽然 线程 比 进程 更 容易 创建 和 撤销 ， 但 是 它们 的 创建 还 是 会 有 一 些 开销 的 。 因 此 ， 一 
些 线程 软件 包 将 会 在 被 程序 第 一 次 调用 的 时 候 创 建 一 组 线程 结构 ， 称 之 为 线程 池 (thread 
pool) 。 当 父 线程 要 求 创建 一 个 新 线程 时 ， 就 从 该 线程 池 中 取出 一 个 结构 ， 初 始 化 为 特定 线 
程 ， 然 后 予以 使 用 。 而 当 对 应 线程 结束 退出 时 ， 相 应 结构 便 被 返回 到 线程 池 中 。 

线程 存在 的 一 个 问题 是 ， 并 不 是 所 有 的 库 例 程 都 准备 和 设计 成 了 “在 没有 完成 一 次 调用 
前 就 开始 了 另 一 次 调用 ”的 多 次 调用 模式 。( 这 被 称 为 “ 重 入 ”(Reentrancy)。) 当 一 个 进程 运 
行 在 具有 多 个 处 理 器 的 系统 上 时 ， 这 便 成 了 一 个 特别 的 问题 。 假 设 一 个 库 例 程 被 一 个 线程 调 
用 ,并 且 该 库 例 程 在 运行 过 程 中 使 用 了 一 个 静态 的 局 部 变量 。 现 在 ， 同 一 进程 的 运行 在 另 一 
个 处 理 器 上 的 另 一 个 线程 调用 了 相同 的 库 例 程 ， 并 尝试 使 用 相同 的 静态 局 部 变量 。 很 容易 看 
出 ， 这 里 会 有 一 个 问题 。 一 般 来 说 ， 库 例 程 应 当 通过 总 是 在 堆栈 ( stack， 或 简称 栈 ) 上 分 配 
局 部 变量 就 能 够 处 理 这 种 情况 。 按 这 种 方式 编写 代码 的 库 被 称 为 线程 安全 的 ( thread-safe)， 


7 
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图 8-7 多 对 多 线程 映射 模型 


a 
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而 大 多 数 现代 的 库 都 是 线程 安全 的 。 


8.6.4 同时 多 线程 


在 同时 多 线程 (Simultaneous Multi Threading，SMT) 中 ,来 自 多 个 进程 的 指令 可 以 同 
时 在 单个 处 理 器 上 执行 。 其 实质 是 硬件 创建 了 逻辑 意义 上 的 另 一 个 处 理 器 。 这 种 处 理 器 并 不 
是 一 种 全 新 的 处 理 器 ， 因 为 它 主要 是 在 两 个 逻辑 处 理 器 之 间 共 享 许多 资源 。 术 语 “ 多 线程 ” 
( multithreading) 有 点 误导 ， 因 为 执行 线程 可 能 来 自 于 不 同 的 进程 。 其 最 大 的 好 处 是 ， 一 个 
进程 会 尝试 访问 不 在 高 速 缓存 中 的 数据 ， 如 果 没 有 同时 多 线程 技术 ， 在 数据 未 准备 就 绪 的 情 
况 下 ， 处 理 器 将 会 被 闲置 起 来 。 其 他 一 般 的 好 处 则 在 于 ， 当 处 理 器 的 部 分 资源 没有 被 一 个 进 
程 使 用 的 时 候 ， 这 些 资源 可 以 被 另 一 个 进程 所 使 用 。 

对 处 理 器 的 主要 增强 包括 增加 在 一 个 周期 内 从 多 个 线程 (或 进程 ) 加 载 指令 的 能 力 以 
及 补充 用 于 保存 来 自 每 个 线程 的 数据 的 一 组 重复 的 寄存 器 。 此 外 ， 还 会 增加 一 些 我 们 还 没 
有 审视 过 的 内 存 管理 硬件 。 在 大 多 数 的 机 器 上 ， 都 有 一 个 称 为 快 表 ( Translation Lookaside 
Buffer，TLB) 的 内 存 寻 址 高 速 缓 存 机 构 。 这 里 的 问题 是 每 个 快 表 项 均 必 须 包 含 用 来 标识 相 
应 表 项 对 应 于 哪个 逻辑 处 理 器 的 相关 数据 ， 因 为 两 个 逻辑 地 址 空间 是 不 可 能 由 硬件 来 进行 区 
分 的 。 同 时 多 线程 体系 结构 的 最 大 优势 往往 会 出 现在 当 两 个 处 理 器 都 运行 来 自 于 一 个 进程 的 
线程 的 情况 下 ， 因 为 它们 能 够 更 有 效 地 共享 资源 。 芯 片 设计 的 复杂 性 通常 将 逻辑 处 理 器 的 数 
量 限 制 为 两 个 。 还 有 ， 度 量 同 时 多 线程 技术 的 有 效 性 可 能 会 比较 困难 。 在 某 些 情况 下 ， 可 以 
看 到 30% 甚至 更 高 的 性 能 提升 ， 但 是 在 个 别 情况 下 ， 人 性 能 实际 上 会 有 所 降低 。 今 天 最 常见 
的 同时 多 线程 实现 是 英特尔 的 超 线程 (Hyper-Threading™)。 


8.6.5 ”进程 与 线程 


线程 和 进程 都 是 向 一 个 应 用 程序 加 入 并 行 化 特性 的 方法 。 进 程 是 独立 的 实体 ， 每 个 进 
程 都 包含 自己 的 状态 信息 和 地 址 空间 。 它 们 只 有 通过 操作 系统 及 进程 间 通 信 机 制 才能 够 彼此 
交流 互动 。 在 设计 阶段 ， 应 用 程序 通常 会 被 划分 为 若干 进程 。 当 从 逻辑 上 分 离 重 要 的 应 用 程 
序 功 能 是 有 意义 的 情况 下 ， 一 个 控制 进程 便 会 调用 其 他 进程 。 换 句 话 说， 进程 是 一 种 设计 
概念 。 

相 比 之 下 ， 线 程 则 是 一 种 不 影响 应 用 程序 体系 结构 的 编码 技术 。 一 个 进程 通常 会 包含 多 
个 线程 。 一 个 进程 中 的 所 有 线程 共享 相同 的 状态 和 相同 的 存储 空间 ， 并且 它们 直接 通过 操纵 
共享 数据 来 实现 彼此 的 通信 。 

在 往往 被 认为 不 是 必须 按 顺 序 执行 而 是 可 以 并 行 地 运行 的 一 系列 任务 的 短期 使 用 场合 ， 
一 般 来 说 就 可 以 创建 线程 。 当 不 再 需要 时 ， 线 程 就 可 以 被 撤销 掉 。 一 个 线程 的 范围 局 限于 特 
定 的 代码 模块 中 ， 因 此 我 们 可 以 将 线程 机 制 引入 一 个 进程 中 ， 而 不 会 影响 到 整个 应 用 程序 的 
设计 。 


8.7 ”实例 研究 


我 们 已 经 讨论 了 进程 和 线程 ， 其 间 用 到 了 一 个 理想 模型 以 试图 解释 清楚 它们 的 各 种 各 样 
的 特征 。 在 真实 的 操作 系统 领域 ,没有 操作 系统 会 恰好 按照 我 们 所 描述 的 那样 运作 。 此 外 ， 
虽然 相关 模型 可 能 非常 接近 于 实际 情况 ， 但 操作 系统 文档 所 使 用 的 术语 可 能 与 我 们 的 模型 并 
不 相同 。 在 本 节 中 ,我 们 将 会 介绍 一 些 现代 的 系统 ， 并 说 明 它们 与 我 们 的 理想 化 模型 之 间 的 
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区 别 ， 同 时 也 会 撒 带 讨 论 一 下 它们 的 术语 。 
8.7.1 POSIX 线程 


我 们 在 前 面 已 经 解释 过 POSIX 标准 ， 其 试图 对 分 支 激增 、 广 泛 扩散 的 UNIX 操作 系统 
的 应 用 程序 接口 建立 起 统一 的 标准 ， 而 其 中 就 有 一 项 标准 与 线程 有 关 。 这 项 标准 是 众所周知 
的 ， 并 有 一 个 特殊 的 名 称 Pthread。 然 而 ， 除 UNIX 之 外 ，POSIX 库 在 许多 操作 系统 上 也 都 
是 可 以 利用 的 ， 因 为 已 经 使 用 这 些 应 用 程序 接口 的 系统 调用 实现 了 大 量 的 程序 。 或 许 你 还 记 
得 ， 即 使 是 Windows NT 系列 也 拥有 一 个 库 ， 可 以 在 源 代码 级 别 上 支持 一 些 POSIX API 的 
系统 调用 。 正 是 由 于 这 种 广泛 的 可 用 性 ，POSIX 线程 便 拥有 了 真正 的 生存 发 展 环境 : 它们 
为 应 用 程序 提供 了 很 高 级 别 的 可 移植 性 。 这 项 标准 如 此 闻名 ， 甚 至 于 在 IBM Fortran 编译 器 
中 也 有 一 个 实现 版 本 ! 8 尽管 如 此 ， 请 牢 牢 记 住 ，POSIX 不 是 一 个 软件 包 ， 而 是 一 项 标准 。 
每 个 实现 者 可 以 采用 任何 合适 的 方式 自由 地 实现 相关 服务 。 

任何 POSIX 线程 的 实现 都 可 以 写成 纯粹 的 用 户 线程 软件 包 。 但 是 ， 如 果 操 作 系统 支持 
内 核 线程 ， 那 么 POSIX 线程 软件 包 往 往 会 使 用 一 对 一 或 多 对 多 模型 来 实现 。 当 开发 一 个 应 
用 程序 且 其 基于 POSIX API 运行 时 ， 这 便 显 示 出 了 POSIX 线程 标准 的 不 利 的 一 面 。 如 果 系 
统 将 要 运行 在 一 个 基于 用 户 级 线程 实现 的 软件 包 上 ,那么 任何 线程 中 的 一 个 阻塞 性 调用 将 会 
阻塞 整个 进程 。 但 是 ， 如 果 对 应 软件 包 支持 内 核 级 线程 ， 那 么 操作 系统 可 以 同时 为 单个 进程 
运行 多 个 线程 。 因 此 ， 如 果 一 个 应 用 程序 员 真正 想 要 充分 利用 多 线程 而 不 考虑 要 使 用 的 特定 
的 软件 包 ， 那 么 程序 必须 使 用 异步 输入 / 输出 操作 来 编写 ， 从 而 避免 阻塞 整个 进程 。 所 以 ， 
如 果 程 序 运 行 在 使 用 内 核 级 线程 实现 的 环境 中 ， 那 么 是 不 会 因为 一 个 线程 发 出 阻塞 性 调用 就 
阻塞 整个 进程 的 ， 于 是 在 使 用 异步 调用 开发 程序 方面 所 付出 的 努力 就 被 白白 浪费 掉 了 。 这 是 
开发 商 为 了 获得 POSIX 的 可 移植 性 而 必须 要 付出 的 代价 。 

在 Pthreads 标准 中 有 超过 60 个 可 以 用 到 的 函数 ， 而 其 中 只 有 22 个 是 与 线程 本 身 的 基 
本 机 能 有 关 的 ， 其 他 三 分 之 二 与 同步 及 进程 间 通 信 相 关 。 我 们 将 在 下 一 章 中 讨论 另外 的 这 些 
主题 。 


8.7.2 Windows NT 


我 们 正在 讨论 的 操作 系统 ， 没 有 任何 一 种 操作 系统 是 精确 地 按照 我 们 所 描述 的 方式 来 实 
现 线程 和 进程 的 。Windows NT 就 是 第 一 个 这 样 的 例子 。Windows NT 的 确实 现 了 进程 ， 但 
它 却 没 有 调度 进程 。 进 一 步 说 ， 它 为 每 个 进程 提供 了 一 个 线程 ， 即 使 有 关 应 用 程序 从 来 没有 
表示 过 它 想 使 用 线程 。 所 以 ，Windows NT 调度 的 是 线程 而 不 是 进程 。 这 样 ， 内 核 只 需要 操 
心 一 类 被 调度 的 实体 ， 那 就 是 线程 。 于 是 ， 一 些 信息 被 保存 在 进程 控制 块 中 ， 还 有 一 些 信息 
则 被 保存 在 线程 控制 块 中 。 如 果 应 用 程序 从 不 调用 线程 软件 包 以 创建 任何 其 他 的 线程 ， 那 么 
只 会 用 到 第 一 个 线程 。 

Windows NT 采用 多 级 反馈 队列 的 调度 机 制 ， 其 具体 使 用 了 32 个 队列 ， 如 图 8-8 所 示 。 
其 中 ， 靠 前 的 16 个 队列 被 认为 是 “实时 ”队列 ， 而 普通 的 应 用 程序 则 运行 在 靠 后 的 16 个 队 
列 中 。 就 Windows NT 而 言 ， 在 其 调度 处 于 较 低 优先 级 队列 中 的 一 个 线程 之 前 ， 总 是 为 较 高 
优先 级 队列 中 处 于 就 绪 状 态 的 所 有 线程 提供 调度 服务 。 此 外 ，Windows NT 是 抢占 式 的 。 如 
果 一 个 线程 一 直 在 等 待 某 个 事件 而 该 事件 业已 发 生 ， 并 且 当 前 正在 运行 的 线程 的 优先 级 比 刚 
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刚 转 入 就 绪 状 态 的 线程 的 优先 级 低 ， 那 么 正在 运行 的 线程 所 占用 的 处 理 器 将 会 被 抢夺 过 来 ， 
而 让 刚刚 转 人 就 绪 状态 的 线程 调度 运行 。 对 于 线程 的 运行 ， 如 果 它 们 运行 完 一 个 时 间 片 而 没 
有 执行 任何 阻塞 性 输入 /输出 操作 ,那么 它们 将 被 降级 到 下 一 个 较 低 优先 级 。 这 里 设想 此 类 
线程 的 行为 更 像 一 个 后 台 任 务 而 不 是 一 个 前 台 任 务 一 一 即 属于 计算 密集 型 的 任务 一 一 所 以 我 
们 会 较 低频 度 地 运行 此 类 线程 。 类 似 地 ， 未 用 完 时间 片 的 线程 最 终 将 会 被 提升 到 更 高 优先 级 
的 队列 中 。 当 一 个 线程 被 创建 时 ， 它 将 配备 上 与 其 相关 联 的 一 个 最 高 优先 级 和 一 个 最 低 优 先 
级 ， 而 且 线程 优先 级 的 提升 或 降低 不 会 超过 其 所 关联 的 优先 级 限制 范围 。 


标准 
优先 级 
(动态 ) 





EO 
图 8-8 Windows NT 线程 优先 级 关系 


鉴于 具有 图 形 化 用 户 界面 的 个 人 计算 机 的 主要 目的 是 使 用 户 能 够 更 加 高 效 地 工作 ， 所 以 
与 图 形 化 用 户 界 面相 关联 的 线程 往往 比 运 行 一 个 应 用 程序 的 处 理 功能 方面 的 线程 拥有 更 高 的 
优先 级 。 此 外 ， 总 有 一 个 窗口 是 持 有 焦点 的 窗口 。 与 持 有 焦点 的 窗口 相关 联 的 任何 线程 将 会 
被 临时 提升 若干 优先 级 别 ， 并 且 它 们 的 时 间 片 扩大 为 三 倍 。 这 一 提升 将 有 助 于 确保 用 户 的 操 
作 得 到 快速 的 响应 ， 同 时 对 应 线程 能 够 完成 其 任务 且 其 间 不 会 遭受 处 理 器 被 抢占 的 情况 。 

最 低 优 先 级 是 为 称 作 系统 空闲 任务 的 作业 预 留 的 。 只 有 当 系 统 中 没有 其 他 线程 准备 好 可 
以 运行 时 ， 这 个 线程 才 会 运行 。 然 而 在 许多 情况 下 ,在 个 人 工作 站 上 ， 这 个 线程 通常 会 消耗 
处 理 器 98% 左右 的 可 利用 时 间 。 也 就 是 说 ， 我 们 的 个 人 计算 机 通常 在 这 方面 比 我 们 对 它们 
完成 我 们 所 做 的 许多 任务 的 要 求 快 得 多 。 这 种 大 量 的 可 用 处 理 器 周期 正 开 始 被 诸如 “外 星 文 
明 探 寻 ”" (SETIS) 和 “梅森 素数 大 搜索 ”(GIMPS 9) 此 类 的 应 用 程序 挖掘 出 来 。 这 些 程序 使 
用 志愿 计算 机 上 的 空闲 处 理 器 周期 来 为 大 规模 科学 实验 进行 批量 数据 的 处 理 ， 其 间 相 关 数 据 
通过 互联 网 下 载 和 更 新 。 这 些 系统 类 似 于 网 格 计算 ( grid computing)， 即 一 种 尝试 挖掘 校园 
环境 中 的 桌面 计算 机 上 的 未 使 用 的 处 理 器 周期 以 运行 某 些 计 算 密集 型 程序 的 技术 。 我 们 曾经 
在 第 7 章 讨 论 了 这 个 概念 ， 并 将 在 第 17 章 中 做 进一步 的 解释 说 明 。 

Windows NT 也 可 以 用 作 服 务 器 系统 。 总 的 来 说 ， 其 服务 器 版 本 的 软件 代码 与 个 人 工作 
站 版 本 的 软件 代码 是 相同 的 ， 主 要 的 区 别 在 于 对 系统 调整 参数 所 选 定 的 取 值 。 例 如 ， 其 各 个 
队列 的 时 间 片 比 工 作 站 版 本 中 的 相同 队列 的 时 间 片 一 般 会 大 6 倍 。 你 应 当 记 得 ， 切 换 程 序 上 
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下 文 被 认为 是 管理 开销 ， 而 不 是 “有 用 ”的 工作 ， 所 以 当 我 们 不 需要 时 应 尽量 避免 上 下 文 切 
换 。 在 工作 站 上 ， 整 个 的 焦点 集中 在 用 户 身 上 ， 而 且 无 论 如 何 都 会 有 许多 空闲 的 处 理 器 周 
期 所 以 我 们 愿意 付出 额外 的 代价 来 使 操作 系统 对 用 户 的 那些 输入 做 出 更 加 快速 的 响应 。 然 
而 在 服务 器 环境 中 ， 我 们 更 关心 针对 许多 服务 请 求 的 总 的 吞吐 量 ， 并 且 我 们 拥有 较 少 的 空闲 
处 理 器 时 间 ， 所 以 我 们 会 增 大 时 间 片 ， 从 而 使 我 们 在 上 下 文 切换 方面 花费 更 少 的 时 间 。 


8.7.3 Solaris 


Solaris 操作 系统 的 线程 支持 机 制 曾 一 度 是 操作 系统 讨论 的 主要 内 容 ， 因 为 其 架构 相当 复 
杂 ， 同 时 还 为 程序 设计 人 员 提 供 了 一 种 模型 选择 途径 。 以 获取 用 户 级 线程 实现 和 内 核 级 线程 
实现 之 间 的 最 佳 可 能 的 平衡 。Solaris 所 使 用 的 基本 模型 是 多 对 多 模型 。Solaris 创建 了 一 种 
所 谓 “ 轻 量 级 进程 ”(Light-Weight Process，LWP) 的 结构 。 轻 量 级 进程 是 由 操作 系统 设置 而 
运行 在 处 理 器 上 的 部 件 。 用 户 级 线程 将 会 被 绑 定 到 轻 量 级 进程 上 。 就 线程 如 何 被 绑 定 到 轻 量 
级 进程 上 的 方案 ， 应 用 程序 设计 人 员 拥 有 相当 大 的 灵活 性 ， 且 线程 可 以 按 组 创建 。 一 方面 ， 
程序 可 以 要 求 一 个 线程 绑 定 到 一 个 轻 量 级 进程 上 上。 于 是 ， 有 关 程 序 设计 人 员 可 以 近似 为 是 运 
用 了 一 对 一 模型 ， 虽 然 此 库 例 程 将 会 比 专门 为 纯粹 的 一 对 一 模型 创建 的 库 稍 微 慢 一 些 ， 毕 
竟 它 还 要 支持 较为 复杂 的 映射 。 例 如， 程序 可 以 要 求 一 个 组 里 有 M 个 线程 和 N 个 轻 量 级 进 
程 。 为 此 ， 在 一 组 中 ， 如 果 某 个 特定 的 线程 执行 了 阻塞 性 调用 ， 则 绑 定 到 该 线程 上 的 轻 量 级 
进程 将 会 被 阻塞 。 但 是 ， 该 组 中 的 其 他 轻 量 级 进程 不 会 自动 地 被 阻塞 ， 并 且 每 当 该 组 中 的 一 
个 用 户 线程 已 准备 就 绪 可 以 运行 时 ， 该 用 户 线程 便 可 以 被 动态 地 分 配给 那些 轻 量 级 进程 。 此 
外 ， 对 于 真正 高 性 能 的 应 用 程序 ， 还 可 以 指定 在 本 章 前 面 所 提 到 的 “处 理 器 亲 和 性 ”， 因 为 
该 机 制 允许 只 有 绑 定 到 对 应 应 用 程序 的 轻 量 级 进程 才 可 运行 在 特定 处 理 器 (或 特定 的 处 理 咒 
组 ) 上 。 

然而 ， 从 Solaris 发 行 版 8 开始 ， 这 种 精心 设计 的 机 制 正在 逐步 被 淘汰 。Sun 公司 的 操 
作 系 统 设计 人 员 已 确定 这 种 机 制 并 不 值得 费 尽 心思 。 也 可 能 是 反映 了 内 存 成 本 的 持续 下 降 
吧 ， 这 种 复杂 的 模型 已 逐渐 被 撤销 。 一 种 新 的 称 为 T2 库 的 可 选择 的 线程 库 被 创建 了 ， 其 仅 
仅 支 持 一 对 一 模型 。 在 Solaris 8 中 仍然 支持 旧 库 ， 但 是 ， 对 于 Solaris 发 行 版 9 而 言 ，T2 模 
型 则 成 为 标准 库 ， 而 旧 的 模型 已 被 淘汰 出 局 。Sun 公司 期 望 ， 通 过 增强 相关 库 的 简单 性 ， 推 
动 大 多 数 情 况 下 的 更 快 操作 以 及 更 少 的 错误 和 支持 问题 。 对 于 程序 设计 人 员 和 系统 管理 员 来 
讲 ，T2 模型 也 应 当 会 更 简单 些 。 


8.7.4 Linux 


Linux 关于 进程 和 线程 所 采用 的 方法 也 不 同 于 我 们 的 基本 模型 。 官 方 的 Linux 文献 并 不 
使 用 这 些 术 语 (虽然 许多 作者 使 用 )。 相 反 ， 他 们 称 其 为 任务 (task)。 一 个 任务 等 同 于 我 们 
一 直 宣 称 的 进程 。Linux 支持 与 大 多 数 UNIX 系统 相同 效果 的 fork 系统 调用 ,但 是 它 使 用 一 
种 称 为 写 时 复制 ( copy-on-write) 的 内 存 管理 技术 来 创建 子 任务 。 这 种 技术 人 允许 以 非常 少 的 
开销 来 创建 子 任务 。 写 时 复制 技术 将 在 第 11 章 展开 进一步 讨论 。 当 一 个 主任 务 通过 clone 
系统 调用 来 启动 男 一 个 任务 时 ,Linux 便 呈 现 出 其 差异 性 的 一 面 。 这 里 是 clone 系统 调用 的 
语法 描述 : 

#include <sched.h> 


int clone(int (*fn) (void *), void *child stack, int flags, 
void *args); 
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第 一 个 区 别 是 ， 对 于 fork 系统 调用 而 言 ， 父 任务 和 子 任务 均 会 在 发 生 该 系统 调用 后 继续 执 
行 下 一 条 指令 ; 而 对 于 clone 系统 调用 来 说 ， 函 数 名 ( *fn) 作为 参数 传递 给 系统 调用 ， 父 任 
务 返回 并 在 fork 之 后 的 下 一 个 指令 处 继续 执行 ,但 是 子 任务 将 调用 作为 参数 传 入 的 那个 也 
数 。 当 该 函数 结束 退出 时 ， 子 任务 便 运 行 结 束 ， 并 且 该 函数 的 值 作为 返回 代码 返回 到 父 任 
务 。 这 类 似 于 线程 调用 在 其 他 操作 系统 中 的 工作 方式 。 

与 clone 系统 调用 的 另 一 个 主要 区 别 则 与 父 任 务 和 子 任务 之 间 的 共享 信息 有 关 。 通 常情 
况 下 ， 在 单个 任务 (或 进程 ) 中 运行 的 所 有 线程 均 会 共享 代码 段 、 数 据 段 以 及 其 他 资源 ( 例 
如 打开 的 文件 )， 但 是 每 个 线程 都 有 自己 的 线程 控制 块 用 来 保存 处 理 器 状态 和 其 自己 的 堆栈 
(可 能 是 两 个 堆栈 ， 即 一 个 用 于 用 户 模式 下 的 堆栈 和 一 个 用 于 内 核 模 式 的 堆栈 )。 在 Linux 平 
台 下 ， 当 一 个 任务 克隆 一 个 子 任务 时 ， 前 者 将 会 提供 一 个 位 掩 码 来 指定 子 任务 与 父 任 务 对 象 
所 共享 的 元 素 。clone 系统 调用 可 利用 的 一 些 标志 包括 : 

e CLONE_VM 一 一 共享 整个 内 存 空 间 
CLONE_FILES 一 一 共享 文件 描述 符 
CLONE_SIGHAND 一 一 共享 信号 处 理 程序 
CLONE_PID 一 一 共享 进程 标识 符 

e CLONE FS 一 一 共享 文件 系统 
为 解释 清楚 这 些 标志 如 何 使 用 及 其 可 能 导致 的 不 同 结果 ， 这 里 举例 加 以 说 明 : 如 果子 任务 和 
父 任务 不 共享 相同 的 文件 系统 ， 那 么 当 子 任务 执行 chdir 调用 和 改变 当前 工作 目录 时 ， 则 父 
任务 的 当前 目录 将 不 会 改变 。 而 如 果 两 个 任务 共享 相同 的 文件 系统 ， 则 两 个 任务 都 将 看 到 当 
前 目录 的 这 种 变化 。clone 系统 调用 可 用 来 创建 一 个 与 大 多 数 操作 系统 中 的 新 进程 等 价 的 新 
任务 。 就 这 项 操作 的 执行 结果 而 言 ， 其 只 不 过 是 没有 在 父 任务 和 子 任务 之 间 共 享 任何 东西 而 
已 。 但 是 ， 启 动 等 同 于 在 大 多 数 操作 系统 中 的 线程 的 一 个 任务 牵涉 共享 除了 进程 标识 符 之 外 
的 所 有 内 容 。 


clone (CLONE VM| CLONE FS| CLONE FILES| CLONE SIGHAND, 0); 


在 执行 clone 系统 调用 之 前 ， 父 进程 将 为 子 任务 分 配 栈 空间 。 父 进程 将 向 clone 系统 调用 传 
递 一 个 指针 (* child_stack) 以 指向 为 子 任务 所 设置 的 堆栈 空间 。 父 进程 必须 确定 子 进程 即 
将 执行 的 操作 需要 多 大 的 空间 。 一 般 情 况 下 ， 子 任务 的 堆栈 空间 将 设置 为 与 父 进程 的 堆栈 空 
间 相 同 的 大 小 。clone 系统 调用 的 最 后 一 个 参数 则 是 一 个 指针 ， 用 来 指向 传递 给 子 进程 即将 
执行 的 函数 的 参数 。 











8.7.5 Java 


Java 程序 设计 语言 和 运行 时 环境 是 线程 的 一 个 很 有 趣 的 例子 ， 因 为 Java 是 一 种 语言 
而 不 是 一 种 操作 系统 。Java 是 在 语言 级 别 上 支持 线程 ， 而 不 是 像 其 他 编程 语言 那样 通过 
子 例 程 调 用 来 支持 线程 。 当 然 ，Java 在 许多 不 同 的 操作 系统 上 都 有 实现 。 最 初 ，Java 线 
程 也 有 与 POSIX 线程 相同 的 问题 ， 即 没有 办 法 知道 程序 是 以 内 核 级 线程 方式 还 是 用 户 级 
线程 方式 来 加 以 执行 。 为 此 ，Sun 公司 为 Java 实现 了 两 个 线程 库 ， 包 括 一 个 可 以 在 没有 
内 核 级 线程 支持 情况 下 实现 的 “绿色 ” 库 ， 但 该 库 还 提供 了 与 内 核 级 线程 所 提供 的 相同 
的 非 阻 塞 模型 。 根 据 相 应 的 操作 系统 ， 这 些 库 可 能 基于 内 核 级 线程 ， 也 可 能 基于 用 户 级 
线程 。 
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8.8 “小 结 


在 本 章 中 ,我 们 首先 定义 了 进程 的 状态 及 其 在 进程 控制 块 的 内 容 中 被 捕获 的 方法 。 然 
后 ， 我 们 定义 了 各 种 模型 来 描述 系统 中 进程 的 状态 以 及 导致 进程 从 一 个 状态 转换 到 另 一 个 
状态 的 各 种 事件 。 接 下 来 ,我 们 介绍 了 用 在 操作 系统 进程 调度 中 的 各 种 算法 ， 并 讨论 了 如 
何 利用 确定 性 建 模 来 评估 这 些 算 法 。 我 们 以 进程 创建 的 简明 扼要 的 阑 述 结束 了 进程 部 分 的 
讨论 。 

在 此 基础 上 ， 我 们 给 出 了 线程 的 定义 ， 并 讨论 了 进程 和 线程 之 间 的 区 别 。 然 后 ， 我 们 解 
释 了 用 户 级 线程 和 内 核 级 线程 之 间 的 不 同 。 接 下 来 ,我 们 说 明了 用 户 级 线程 可 能 映射 到 内 核 
级 线程 的 各 种 方式 。 最 后 ， 我 们 介绍 了 现代 操作 系统 中 线程 的 实现 ， 具 体 讨论 了 线程 机 制 的 
几 种 特殊 案例 。 

在 本 书 的 下 一 章 ， 我 们 将 讨论 进程 如 何 通信 和 协作 ， 以 及 相关 领域 所 涉及 的 一 些 问题 。 
需要 指出 的 是 ， 这 些 问题 并 不 像 它 们 乍 看 起 来 那么 简单 。 
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8.3 


什么 是 PCB ? 

a. 一 类 有 毒 的 化 学 化 合 物 
b. 进程 控制 块 

c, 程序 计数 器 边界 

d. 部 分 完成 的 缓冲 区 

e. 以 上 都 不 是 


在 进程 的 上 下 文中 ,“ 状 态 ” 这 个 词 被 多 次 用 到 。 请 就 进程 而 言 ， 
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区 分 这 个 词 的 两 种 含义 。 


一 个 进程 可 以 处 于 多 少 种 的 独特 的 操作 系统 状态 ? 


8.4 ”一般 而 言 ， 针 对 就 绪 状 态 会 设置 多 少 个 队列 ? 
8.5 ”一般 而 言 ， 针 对 等 待 状态 会 设置 多 少 个 队列 ? 
8.6 ”为 什么 我 们 会 介意 一 个 进程 调度 程序 是 否 公平 ? 
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8.7 ”按照 最 初 的 描述 ， 最 短 运行 时 间 (SRTF) 进程 优先 调度 算法 是 最 佳 的 ， 但 为 什么 我 们 不 使 用 它 呢 ? 
8.8 ”既然 先 来 先 服务 (FCFS) 进程 调度 算法 是 那么 公平 ， 它 又 存在 什么 问题 呢 ? 
8.9 为 什么 具有 图 形 化 用 户 界面 的 系统 通常 没有 长 程 调度 器 ? 


8.10 
8.11 
8.12 
8.13 
8.14 


8.15 
8.16 
8.17 


8.18 
8.19 
8.20 


8.21 


处 理 器 亲 和 性 的 目的 是 什么 ? 

一 个 进程 执行 什么 操作 来 启动 另 一 个 进程 呢 ? 

比较 进程 和 线程 的 不 同 之 处 。 

为 什么 我 们 经 常 说 内 核 级 线程 比 用 户 级 线程 要 好 些 ? 

用 户 级 线程 软件 包 是 在 内 核 级 线程 软件 包 出 现 之 前 开发 完成 的 。 当 内 核 级 线程 可 以 使 用 后 ， 用 
户 不 想 丢弃 或 重 写 他 们 的 多 线程 应 用 程序 。 因 此 ， 用 户 级 线程 软件 包 被 重新 编码 以 与 内 核 级 线 
程 一 起 工作 。 我 们 谈 到 的 用 来 把 用 户 级 线程 映射 到 内 核 级 线程 的 三 种 模型 是 什么 ? 

当 我 们 说 一 个 库 是 “线程 安全 ”的 时 候 ， 具 体 是 指 什么 意思 ? 

同时 多 线程 是 指 同 时 有 多 个 进程 创建 线程 。 这 种 说 法 是 否 正确 ? 

从 普遍 存在 的 意义 上 来 讲 ，POSIX 线程 似乎 是 理想 的 。 那 么 ，POSIX 线程 存在 的 主要 缺点 是 
什么 ? 

Windows NT 进程 调度 有 什么 独特 之 处 ? 

Linux 进程 调度 有 什么 独特 之 处 ? 

Solaris 提供 了 一 种 精心 设计 的 机 制 用 于 将 用 户 级 线程 映射 到 “ 轻 量 级 ”进程 上 。 为 什么 要 这 
样 做 ? 

Java 线程 有 什么 不 寻常 的 地 方 ? 
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在 本 章 ， 我 们 将 继续 深入 讨论 进程 和 线程 的 相关 内 容 。 为 了 保持 代表 有 关 应 用 程序 的 系 
统 更 加 忙碌 地 运行 ， 应 用 程序 可 以 设计 和 划分 成 多 个 部 分 ,我 们 将 围绕 相关 技术 展开 讨论 。 
当 我 们 把 应 用 程序 分 解 成 多 个 不 同 的 部 分 时 ， 这 些 部 分 之 间 需 要 相互 协作 ， 而 为 了 做 到 这 一 
点 ， 它 们 便 需 要 彼此 通信 。 前 面 我 们 花费 了 相当 多 的 时 间 来 解释 操作 系统 为 什么 要 把 进程 独 
立 出 来 以 及 如 何 实现 进程 间 的 相互 隔离 ， 现 在 我 们 则 需要 阐明 为 允许 它们 通信 而 演化 形成 的 
有 关机 制 。 

操作 系统 专门 投入 了 大 量 的 资源 来 确保 各 个 进程 彼此 之 间 的 相对 独立 。 更 确切 地 来 说 ， 
一 个 独立 型 进程 (independent process) 是 不 会 影响 另外 一 个 进程 的 执行 的 ， 同 时 ， 一 个 独立 
型 进程 也 不 会 受到 另外 一 个 进程 的 执行 的 影响 。 而 另 一 方面 ， 我 们 有 时 会 需要 两 个 或 多 个 进 
程 相互 协作 。 同 样 ， 准 确 地 来 讲 ， 一 个 协作 式 进 程 ( cooperating process) 是 一 个 会 影响 到 另 
外 一 个 进程 的 执行 的 进程 ， 或 者 是 一 个 会 受到 另外 一 个 进程 的 执行 的 影响 的 进程 。 当 我 们 试 
图 开发 系统 时 ， 我 们 有 可 能 需要 允许 对 应 系统 包含 多 个 相互 协作 的 进程 ， 而 且 ， 有 时 我 们 会 
需要 其 中 一 部 分 进程 运行 在 不 同 的 机 器 上 ， 有 时 则 需要 相关 进程 运行 在 同一 台 机 器 上 。 无 论 
哪 一 种 情况 ， 这 些 协 作 进程 将 需要 执行 若干 操作 事项 以 便 彼 此 可 以 成 功 协作 来 完成 相应 的 任 
务 。 训 无 疑问 ， 它 们 需要 相互 通信 (communication)。 例 如 ， 一 个 进程 可 能 在 接收 销售 订单 ， 
然后 它 可 能 会 把 这 些 订 单传 递 给 另 一 个 进程 ， 而 后 者 将 开始 办 理 运送 商品 的 相关 事务 。 同 
时 ， 有 关 进 程 也 可 能 需要 同步 它们 的 活动 ， 以 便 它 们 不 会 因为 在 同一 时 间 试 图 更 新 同一 条 信 
息 而 受到 彼此 的 于 扰 。 此 外 ， 当 进程 运行 时 ， 它 们 可 能 需要 请 求 操作 系统 准许 它们 在 一 段 时 
间 内 排他 性 地 访问 某 类 资源 。 事 实证 明 ， 这 种 情况 下 可 能 会 导致 一 种 特殊 类 型 的 问题 ， 即 死 
锁 (deadlock)， 操 作 系 统 需要 对 此 类 问题 投入 特别 的 关注 并 给 以 适当 的 处 理 。 

本 章 将 主要 针对 进程 来 展开 讨论 ， 但 是 ， 其 中 的 大 多 数 内 容 也 同样 适用 于 多 线程 。 特 别 
地 ， 线 程 对 内 存 的 共享 往往 也 会 引发 本 章 中 所 阐述 的 关于 同步 和 和 死 锁 的 诸多 问题 。 然 而 ， 在 
一 般 情况 下 ， 线 程 不 会 使 用 在 进程 之 间 经 常会 用 到 的 消息 传递 机 制 。 

尽管 我 们 未 必 期 望 把 应 用 程序 划分 开 来 ， 但 为 什么 我 们 有 时 候 还 是 会 那样 做 呢 ? 在 第 
9.1 节 中 ,我 们 将 围绕 这 一 问题 背后 的 诱发 因素 展开 讨论 。 接 下 来 ,第 9.2 节 ， 我 们 阐述 了 
协作 式 进 程 在 相互 通信 时 所 使 用 的 各 种 机 制 。 而 在 第 9.3 节 中 ,我们 探讨 了 有 关 进 程 同 步 其 
相关 活动 的 必要 性 ， 并 讨论 了 这 样 做 的 一 些 机 制 。 男 外 ， 当 进程 企图 排他 性 地 访问 资源 时 ， 
就 有 可 能 会 出 现 一 种 潜在 的 问题 ， 即 死 锁 。 为 此 ， 我 们 在 第 9.4 节 中 着 重 讨论 了 死 锁 。 最 
后 ,我 们 在 第 9.5 节 对 整 章 内 容 进 行 了 归纳 总 结 。 


9.1 为 什么 会 有 协作 式 进 程 


在 我 们 详细 了 解 进程 如 何 能 够 通信 的 相关 细节 之 前 ,很 自然 地 就 会 提 这 样 的 问题 为 什 
么 我 们 想 把 我 们 的 系统 分 解 成 多 个 进程 呢 ? 而 关于 为 什么 我 们 想 要 开发 应 用 程序 是 以 若干 部 
分 运行 的 系统 ， 则 存在 如 下 多 方面 的 原因 


锚 9 茧 进程 营 理 进 阶 : 进 翟 间 通 入、 同步 和 死 鱼 。 147 


性 能 ( performance)。 当 我 们 设计 一 个 系统 时 ,我 们 可 能 有 好 多 工作 需要 去 做 ， 即 比 一 
个 较为 廉价 的 处 理 器 能 够 独立 完成 的 工作 量 要 多 。 从 经 济 角度 来 说 ， 花 钱 买 上 若干 便宜 的 处 
理 器 ， 并 让 每 个 处 理 器 上 来 分 别 运行 相应 进程 的 某 二 部 分 ， 要 比 买 上 一 台 可 以 完成 整 项 任务 
的 比较 大 的 系统 更 为 合算 。 而 如 果 对 应 系统 需要 为 大 量 用 户 服务 ， 则 采用 唯一 的 一 个 系统 可 
能 无 法 为 全 部 用 户 提供 服务 。 

规模 扩展 ( scaling， 或 称 为 伸缩 性 )。 当 我 们 最 初 开发 一 个 应 用 程序 时 ， 我 们 不 一 定 知 
道 系统 负载 将 会 有 多 大 。 革 项 我 们 认为 是 很 小 的 服务 功能 ,可 能 在 一 夜 之 间 就 会 引起 色 动 ， 
因为 它 可 能 会 要 求 为 比 我 们 原先 设想 要 多 出 许多 的 用 户 来 提供 服务 。 和 谷歌 (Google) 搜索 引 
擎 就 是 一 个 很 好 的 例子 。 无 论 该 项 服务 的 创始 人 有 着 什么 样 的 梦想 或 愿望 ,非常 令 人 怀疑 ， 
他 们 曾经 想象 过 到 2004 年 他 们 将 需要 65 000 台 服 务 器 来 运行 有 关 的 应 用 程序 。 显 而 易 见 ， 
这 项 原因 与 性 能 问题 密切 相关 ， 但 又 明显 不 同 ， 它 们 并 不 是 一 回 事 儿 。 

组 件 购 买 (purchased component)。 我 们 可 能 想 让 我 们 的 系统 包含 某 些 如 万 维 网 服务 器 
之 类 的 功能 。 想 让 我 们 发 现 白手 起 家 去 开发 我 们 自己 的 网 站 服务 器 更 为 经 济 ， 那 是 不 太 可 能 
的 。 我 们 最 有 可 能 是 ， 使 用 一 个 现成 的 网 站 服务 器 程序 ， 并 设法 对 其 进行 修正 一 一 或 许 会 通 
过 编写 所 购买 的 服务 器 系统 中 那些 用 来 动态 创建 系统 所 显示 页 面 的 相关 部 分 一 一 从 而 使 其 成 
为 我 们 的 系统 。 

第 三 方 服务 ( third-party service)。 我 们 的 系统 可 能 会 利用 由 另 一 个 机 构 所 提供 的 某 项 
服务 。 一 个 典型 的 例子 是 登记 信用 卡 费用 。 再 次 强调 ， 想 让 我 们 开发 出 一 个 实现 此 项 功能 的 
系统 能 够 与 购买 相应 服务 一 样 廉价 ， 那 是 不 太 可 能 的 。 除 非 我 们 拥有 非常 多 的 交易 要 进行 处 
理 ， 我 们 才 会 考虑 自己 去 专门 开发 此 类 系统 ， 否 则 我 们 更 倾向 于 付费 给 第 三 方 来 购买 该 项 功 
能 部 件 。 

多 系统 中 的 组 件 。 我 们 可 能 在 构建 一 些 执行 类 似 任 务 的 不 同系 统 。 我 们 往往 不 会 为 许多 
系统 分 别 构建 类 似 的 模块 并 不 得 不 去 单独 对 它们 进行 维护 ， 而 是 可 以 构建 公共 组 件 作 为 单独 
的 进程 来 加 以 运行 ， 并 让 各 种 不 同 的 系统 向 对 应 公共 组 件 提供 和 注入 相应 的 事务 。 例 如 ， 现 
在 有 一 家 直接 面向 公众 销售 的 公司 可 能 要 构建 一 个 网 站 来 支持 客户 从 网 上 在 线 下 订单 以 购买 
货物 。 该 公司 还 可 能 在 商店 中 有 零售 柜台 ， 同 时 针对 电视 购物 节目 设立 有 电话 销售 组 通过 电 
话 来 接受 订单 ， 另 外 还 有 邮购 产品 组 ， 他 们 都 需要 登记 订单 。 这 些 系统 可 能 各 自 以 不 同 的 方 
式 接受 订单 ， 但 均 使 用 到 了 其 他 进程 所 提供 的 公共 服务 ， 首 先是 订单 的 验证 ， 随 后 是 采用 客 
户 信 用 卡 方式 的 订单 费用 的 支付 ， 接 下 来 是 从 仓库 办 理 订单 装运 ， 同 时 还 有 库存 状况 的 监测 
以 及 当 发 现 商 品 似乎 在 低位 运行 时 向 对 应 的 供 货 商 下 订单 和 续 订 商品 。 所 有 这 些 公共 的 组 件 
都 可 以 作为 单独 的 进程 来 运行 。 

可 靠 性 (reliability)。 当 所 有 系统 构建 成 一 个 整体 并 且 都 装 到 同一 台 计 算 机 上 时 ， 那么 
该 计算 机 的 一 个 重大 故障 将 会 导致 整个 系统 的 终止 。 而 如 果 这 些 系 统 是 以 模块 化 方式 构建 起 
来 的 ， 那么 每 个 模块 都 可 以 有 多 个 实例 。 还 是 回 到 前 面 的 谷歌 设计 案例 ， 如 果 10 000 个 系 
统 中 有 一 个 系统 出 现 了 故障 ， 那么 搜索 引擎 系统 将 会 继续 运行 。 具 体 来 说 ， 可 能 有 几 个 用 
户 ， 他 们 的 搜索 已 经 分 配 到 了 那 台 故障 服务 器 上 。 他 们 可 能 不 得 不 去 点 击 “ 刷 新 ”按钮 以 成 
功 获取 搜索 结果 ， 但 将 可 能 完全 不 会 意识 到 主机 站 点 的 某 台 服 务 器 已 经 出 现 了 故障 。 在 谷歌 
的 这 个 案例 中 ， 他 们 甚至 把 有 关 服 务 器 分 开 来 放置 在 不 同 的 地 方 。 这 样 即便 是 像 火灾 或 洪水 
之 类 的 物理 灾难 也 不 会 把 整个 系统 搞 瘫 痪 。 

信息 的 物理 位 置 ( physical location of information )。 即 使 是 一 家 小 公司 ， 有 时 最 终 也 会 
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拥有 多 处 设施 。 通 常 这 种 情况 出 现 是 因为 一 家 公司 并 购 了 其 他 的 公司 。 例 如 ， 不 管 出 于 什么 
原因 ， 我 们 可 能 最 终 会 有 多 个 仓库 ， 而 对 于 大 部 分 的 交易 来 说 ,我 们 通常 想 要 在 相应 的 地 方 
分 别 构建 一 个 库存 系统 。 但 是 ,出 于 其 他 的 考虑 ， 我 们 一 般 希 望 把 该 系统 的 某 些 部 分 放置 在 
某 个 中 心 的 地 点 。 而 鉴于 批量 折扣 等 理由 ,我 们 常常 希望 拥有 一 个 统一 的 集中 采购 功能 。 如 
果 我 们 已 经 设计 了 各 种 仓库 库存 系统 以 便 让 它们 把 库存 请 求 提供 给 此 集中 采购 系统 ， 那 么 我 
们 就 可 以 从 整体 上 把 这 看 作 是 一 个 系统 ， 而 该 系统 的 某 些 部 分 则 分 布 在 不 同 的 物理 位 置 。 

志愿 式 启用 型 应 用 程序 ( enabled application)。 有 极 少数 的 应 用 程序 拥有 非常 海量 的 计 
算 要 求 ， 而 这 种 计算 要 求 的 的 确 确 在 现 有 的 计算 机 系统 上 是 无 法 完成 的 。 有 时 ， 这 在 一 定 程 
度 上 也 是 一 个 经 济 问 题 一 一 是 的 ， 可 以 构建 一 部 计算 能 力 足 够 强大 的 机 器 来 完成 有 关 的 任 
务 ， 但 想 要 解决 这 种 问题 的 组 织 却 往往 承担 不 起 相应 的 费用 。 有 时 我 们 只 好 等 上 几 年 。 笼 统 
地 讲 ， 可 用 处 理 器 的 计算 能 力 每 18 个 月 就 会 翻 上 一 番 。 而 如 果 这 条 定律 持续 地 发 挥 效 用 ， 
那么 我 们 可 能 很 快 就 会 拥有 一 台 计 算 能 力 满 足 相 应 要 求 的 机 器 。 此 类 拥有 海量 计算 要 求 的 系 
统 的 一 个 例子 如 外 星 文明 探寻 (Search for Extra-Terrestrial Intelligence，SETI) 项 目 所 利用 
的 系统 。 该 系统 接收 由 大 型 射电 望远镜 所 记录 的 海量 的 数据 ， 从 中 搜寻 可 能 标明 智能 起 源 的 
数据 模式 。 有 关 的 数据 规模 相当 巨大 ， 因 此 ， 为 了 使 这 些 数据 可 以 利用 当前 可 用 的 机 器 进行 
处 理 ， 就 只 好 把 它们 划分 成 较 小 的 数据 集 ， 并 且 把 有 关 数 据 集 分 发 给 各 种 感 兴趣 的 志愿 者 用 
户 ， 而 这 些 用 户 自 愿 让 自己 的 计算 机 系统 上 的 空闲 时 间 被 用 来 通过 某 种 屏幕 保护 程序 的 相应 
机 制 进行 对 应 数据 的 处 理 。 不 管 你 对 这 项 努力 的 科学 价值 的 看 法 如 何 ， 它 却 当之无愧 地 是 采 
用 这 种 技术 的 第 一 批 系 统 中 的 一 员 。 如 果 把 它 看 作 是 一 个 松散 斐 合 的 系统 ， 那 么 它 就 代表 着 
目前 世界 上 最 大 的 一 个 计算 机 系统 。 不 采用 这 种 “分 而 治之 ”的 方法 ， 这 些 数 据 根 本 无 法 处 
理 的 。 


9.2 进程 间 通 信 


由 于 上 述 的 一 种 或 多 种 原因 ， 现 在 人 们 构建 包含 多 个 协作 式 进 程 的 系统 已 经 有 一 段 时 
间 了 ， 并 且 此 类 系统 的 数量 ， 无 论 从 绝对 数量 还 是 在 新 的 应 用 程序 中 所 占 的 百分比 ， 仍 然 在 
迅猛 地 增长 。 显 而 易 见 ， 如 果 我 们 要 拥有 一 个 由 多 个 进程 所 组 成 的 系统 ， 那 么 这 些 进 程 之 间 
必须 得 互相 通信 以 共同 完成 相应 的 工作 。 然 而 ， 我 们 已 经 花费 了 大 量 的 时 间 和 精力 ， 用 来 确 
保 在 同一 系统 上 运行 的 两 个 进程 不 会 相互 干扰 。 因 此 ， 我 们 需要 开发 相应 机 制 以 允许 进程 间 
进行 通信 。 当 有 关 开 发 人 员 开 始 意识 到 这 种 需要 时 ， 他 们 中 的 那些 在 不 同 环境 中 的 开发 人 员 
采用 了 不 同 的 术语 来 看 待 这 一 问题 ， 同 时 还 运用 了 不 同 的 工具 来 实现 对 应 机 制 。 对 于 使 用 系 
统 网 络 体系 结构 ( System Network Architecture，SNA) 和 同步 数据 链 路 控制 (Synchronous 
Data Link Control，SDLC) 协议 的 国际 商业 机 器 公司 (IBM) 的 大 型 机 客户 来 说 ， 他 们 看 
待 相关 问题 与 使 用 诺 勒 有 限 公 司 网 络 操作 系统 的 个 人 计算 机 用 户 并 不 相同 ， 也 与 使 用 施乐 
网 络 系统 ( XEROX”S Network System，XNS) 协议 或 数字 设备 公司 分 层 网 络 体 系 结构 协议 
( Digital Equipment Corporation network，DECNet) 或 传输 控制 协议 / 网 际 协议 (TCP/IP) 的 
UNIX 或 VAX 用 户 有 所 不 同 。 为 此 ， 如 今 出 现 了 用 于 进程 通信 的 几 十 种 不 同 的 机 制 。 总 体 
上 来 讲 ， 主 要 存在 两 种 截然 不 同类 型 的 进程 间 通 信 ( InterProcess Communication，IPC) 机 
制 。 一 方面 ， 有 许多 消息 传递 机 制 ， 它 们 按照 “消息 ”这 个 术语 所 指定 的 方式 进行 操作 ， 也 
就 是 说 ， 一 个 进程 利用 操作 系统 的 某 项 功能 把 消息 发 送 给 另 一 个 进程 。 而 且 ， 消 息 传递 通常 
是 在 进程 之 间 进 行 。 另 一 方面 ， 则 是 使 用 共享 内 存 ， 其 间 ， 两 个 或 更 多 个 任务 共享 访问 一 块 
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内 存 。 共 享 内 存 空间 在 同一 个 进程 中 的 线程 之 间 是 隐 含 和 不 用 言明 的 ， 但 也 可 以 用 在 进程 之 
间 。 在 具体 讨论 这 两 类 通信 机 制 之 前 ,我 们 首先 对 所 有 相关 机 制 的 共同 特征 进行 抽象 ， 以 便 
当 你 在 面 对 一 种 不 同 的 通信 机 制 时 ， 你 将 会 拥有 一 套 有 组 织 的 结构 来 识别 其 对 应 的 重要 特 
征 。 然 后 ， 我 们 再 来 介绍 一 些 较 为 常见 的 通信 机 制 。 


9.2.1 通信 机 制 的 特性 


可 供 进程 用 来 进行 通信 的 服务 ， 一 般 可 以 按照 如 下 不 同 特性 加 以 描述 : 
®。 一 次 可 以 使 用 单个 信道 的 进程 数 

单 向 连接 或 双向 连接 

缓冲 策略 (没有 缓冲 区 、 单 个 缓冲 区 、N 个 缓冲 区 、 无 限 个 缓冲 区 ) 
面向 连接 的 通信 或 无 连接 的 通信 

命名 策略 (名称 、 单 向 命名 或 双向 命名 、 邮 箱 、 端 口 ) 

多 点 传送 、 广 播 式 传送 、 单 点 传送 

可 能 有 多 个 连接 或 单一 连接 

面向 流 的 通信 或 面向 消息 的 通信 

异 构 通信 或 同 构 通 信 

同步 通信 或 异步 通信 

持久 通信 或 瞬时 通信 

所 支持 的 进程 数 。 在 大 多 数 情况 下 ， 在 特定 的 进程 间 通 信 过 程 中 ， 往 往 只 会 涉及 两 个 进 
程 。 但 在 某 些 情况 下 ， 也 可 能 会 涉及 许多 进程 ， 且 这 些 进 程 之 间 同 时 进行 了 通信 。 例 如 ， 许 
多 进程 可 能 会 同时 共享 了 与 (把 记录 写 入 日 志文 件 的 ) 某 个 进程 之 间 的 连接 。 

单 向 连接 或 双向 连接 。 对 于 协作 式 进程 来 说 ， 尽 管 仅仅 开展 单 向 的 通信 可 能 有 点 稀奇 古 
怪 ， 但 单 向 通信 信道 则 是 稀 琉 平常 的 事情 。 通 常情 况 下 ， 单 向 信道 发 生 的 场合 是 ， 在 两 个 进 
程 之 间 可 能 建立 了 两 个 信道 ,但 是 这 两 个 信道 的 通信 方向 是 相反 的 。 这 种 类 型 的 通信 机 制 往 
往 适 用 于 在 一 个 方向 上 的 通信 任务 要 比 在 另 一 个 方向 上 的 通信 任务 繁重 很 多 的 情况 。 例 如 ， 
一 个 进程 在 向 另 一 个 进程 发 送 交 易 信 息 ， 而 另 一 个 进程 只 需 向 前 一 个 进程 发 送 回 确认 消息 即 
可 。 于 是 ,我们 可 能 在 第 一 个 信道 上 需要 许多 大 容量 的 缓冲 区 ， 但 在 第 二 个 信道 上 则 仅 需要 
少 得 多 或 小 得 多 的 缓冲 区 ， 即 只 需要 较 低 的 带宽 。 

缓冲 策略 。 根 据 可 用 的 缓冲 区 数量 ,存在 没有 缓冲 区 、 单 个 缓冲 区 、N 个 缓冲 区 以 及 无 
限 个 缓冲 区 4 种 不 同 的 通信 信道 缓冲 区 处 理 情 况 。 第 一 种 情况 是 指 ， 没 有 缓冲 区 是 可 以 被 通 
信 的 两 个 进程 都 能 够 访问 的 。 两 个 进程 必须 同时 访问 信道 ， 以 便 一 个 进程 可 以 把 消息 直接 发 
送 给 另 一 个 进程 。 第 二 种 情况 是 指 ， 只 有 一 个 缓冲 区 是 可 以 被 通信 的 两 个 进程 都 能 够 共享 访 
问 的 。 在 这 种 情况 下 ， 首 先 由 发 送 进程 把 一 条 消息 放 人 缓冲 区 中 ， 然 后 告知 操作 系统 该 缓冲 
区 已 准备 好 了 消息 。 接 下 来 ， 操 作 系 统 将 告知 接收 进程 有 新 的 消息 放 在 了 缓冲 区 。 于 是 ， 接 
收 进程 将 消息 从 缓冲 区 中 取出 ， 并 告知 操作 系统 ， 发 送 进程 可 以 发 送 下 一 条 消息 了 。 不 言 而 
喻 ， 单 个 缓冲 区 的 情况 看 起 来 可 能 只 是 N 个 缓冲 区 情况 的 一 种 特例 。 然 而 ， 在 单个 缓冲 区 
的 情况 下 ， 我 们 可 以 使 用 非常 简单 的 机 制 来 同步 有 关 进 程 ， 相 关 进 程 始终 知道 要 使 用 的 是 哪 
个 缓冲 区 ， 并 且 只 需要 做 好 缓冲 区 现在 是 否 可 供 发 送 进程 放 人 新 消息 的 协调 工作 〈 译 者 注 : 
其 实 ， 同 时 还 需要 做 好 缓冲 区 现在 是 否 可 供 接收 进程 从 中 提取 消息 的 协调 工作 。 但 是 考虑 
到 ， 缓 冲 区 可 供 发 送 进 程 放 入 新 消息 和 可 供 接 收 进程 从 中 提取 消息 的 这 两 种 状态 恰好 相反 ， 
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故而 可 以 优化 整合 成 一 种 协调 工作 。 也 就 是 说 ， 当 缓冲 区 现在 可 供 发 送 进程 放 和 人 新 消息 时 ， 
肯定 不 能 供 接收 进程 从 中 提取 消息 ; 相反 ， 当 缓冲 区 现在 不 可 供 发 送 进程 放 人 新 消息 时 ， 肯 
定 可 以 供 接收 进程 从 中 提取 消息 )。 在 V 个 缓冲 区 的 情况 下 ， 我 们 需要 协调 更 多 的 信息 。 每 
个 进程 的 通信 信道 机 制 必 须知 道 是 对 应 于 哪个 通道 的 缓冲 区 、 哪 些 缓 冲 区 包含 了 消息 以 及 哪 
些 缓冲 区 没有 包含 消息 。 我 们 将 会 在 第 9.3.9 节 中 进一步 讨论 相关 问题 。 最 后 一 种 情况 是 指 ， 
相应 信道 机 制 拥 有 一 些 外 部 存储 器 可 以 用 来 扩展 缓冲 空间 ， 且 从 本 质 上 讲 可 以 把 缓冲 区 数量 
扩展 到 无 限 多 个 。 举 例 来 说 ， 在 假 脱 机 系统 中 ， 使 用 磁盘 文件 来 保存 有 关 消 息 流 ， 直 到 有 打 
印 机 可 供 使 用 和 将 其 打印 出 来 为 止 。 从 实际 使 用 的 角度 来 讲 ， 发 送 进程 可 把 有 关 缓 冲 区 看 作 
是 没有 穷尽 的 。 

面向 连接 的 通信 或 无 连接 的 通信 。 一 个 通信 信道 可 以 是 面向 连接 的 ,也 可 以 是 无 连接 
的 。 有 了 时， 通信 的 进程 之 间 可 能 需要 建立 一 个 复杂 的 对 话 。 在 这 种 情况 下 ,它们 很 可 能 要 建 
立 一 个 它们 将 在 交互 期 间 使 用 的 连接 。 这 就 好 比 是 通电 话 ， 一 个 人 在 打 电 话 给 男 一 个 人 。 相 
关 术 语 一 度 是 源 自 于 采用 实际 的 物理 连接 在 设备 之 间 所 建立 的 连接 。 但 是 现在 ， 有 关连 接 很 
可 能 是 逻辑 连接 或 虚拟 连接 。 有 时 ， 一 个 进程 只 是 要 把 消息 发 送出 去 ， 而 并 不 关心 其 他 进程 
在 监听 接收 什么 。 这 样 的 应 用 程序 例子 具体 可 能 是 ， 某 家 公司 的 一 台 服 务 器 正在 广播 股票 购 
买 信息 ， 以 便 客户 端 可 以 在 需要 时 能 够 接收 到 有 关 的 信息 。 这 也 可 以 比 作 是 无 线 电 广播 方 
式 ， 可 能 会 有 数 百 万 的 听众 ， 也 可 能 一 个 听众 都 没有 。 

命名 策略 。 当 发 送 进 程 和 接收 进程 彼此 之 间 要 进行 通信 时 ， 它 们 往往 需要 某 种 机 制 来 
识别 对 方 。 这 称 为 命名 策略 。 在 最 严格 的 情况 下 ,通信 的 双方 进程 都 必须 有 明确 的 名 字 来 辩 
别 对 方 。 大 多 数 情况 下 ， 有 关 名 字 就 是 用 来 运行 对 应 程序 的 可 执行 文件 的 名 称 ， 但 是 这 些 名 
字 一 般 能 够 以 其 他 方式 和 正在 运行 的 进程 关联 起 来 一 一 在 某 些 系统 中 ， 作 为 进程 标识 符 的 数 
字 也 可 能 被 用 作 辨 别 的 名 字 。 这 种 特定 的 命名 机 制 具 有 误差 最 小 ， 即 最 不 容易 引起 错误 的 优 
点 ， 但 是 需要 尽 最 大 努力 去 加 以 维护 。 因 此 ， 这 种 命名 机 制 通常 只 有 在 通信 的 双方 进程 都 是 
由 相同 的 开发 人 员 负 责 设 计 开 发 并 且 只 有 一 个 发 送 进程 和 一 个 接收 进程 的 情况 下 才 会 适用 。 
在 稍 加 宽松 的 模型 中 ,消息 发 送 者 必须 指定 接收 进程 的 名 称 ， 但 接收 者 则 可 以 接受 来 自任 何 
发 送 进程 所 传输 的 消息 。 第 三 种 模型 是 发 送 进程 和 接收 进程 就 它们 即将 共同 使 用 的 某 种 其 他 
引用 方法 达成 一 致 ， 具 体例 子 包 括 邮箱 编号 和 TCP/IP 端口 。 

进程 间 通 信 的 另外 一 种 特性 是 指 ， 有 关 消 息 是 单 点 传送 (unicast)， 还 是 多 点 传送 (multi- 
cast， 或 称 为 多 播 或 组 播 )， 亦 或 广播 式 传送 (broadcast)。 单 点 传送 的 消息 仅仅 被 发 送 给 接收 
者 进程 。 因此， 如 果 是 许多 进程 在 进行 协作 ， 那么 ,为 了 让 所 有 进程 都 接收 到 某 条 消息 ， 可 
能 需要 发 送 许多 条 消息 ， 即 许多 次 发 送 相同 内 容 的 消息 。 尽 管 如 此 , 单 点 传送 的 消息 还 是 
私有 性 质 的 。 广 播 式 传送 的 消息 发 送出 去 之 后 ,， (在 给 定 环境 中 的 ) 每 个 进程 都 可 以 接收 到 。 
这 样 的 例子 ， 比 如 周期 性 地 发 送 时 钟 更 新 消息 的 时 间 服 务 器 ， 任 何 进程 都 可 以 读 取 到 相关 消 
息 。 令 人 遗憾 的 是 ， 广 播 式 传送 的 消息 必须 被 所 有 进程 接收 和 人 处理， 无 论 对 应 进程 对 有 关 消 
息 是 否 感 兴趣 ， 故 而 这 种 方式 可 能 造成 资源 的 极 大 浪费 。 不 过 话 又 说 回来 ， 某 些 消息 ， 壁 如 
系统 关机 请 求 ， 确 实 可 能 需要 被 所 有 的 进程 所 接收 。 多 点 传送 的 消息 旨 在 针对 一 组 接收 者 进 
程 进行 发 送 。 有 时， 这 是 出 于 安全 原因 的 考量 ， 所 以 相应 组 内 的 成 员 资 格 可 能 会 受到 限制 。 
但 是 ， 还 有 些 时 候 ， 多 点 传送 的 组 别 创建 只 是 为 了 能 够 给 那些 对 有 关 消 息 不 感 兴趣 的 进程 节 
省 一 些 资源 一 一 证 券 报 价 应 用 程序 可 能 就 是 一 个 很 好 的 例子 。 

可 能 有 多 个 连接 (或 称 之 为 多 重 连接 ) 或 单一 连接 。 大 多 数 情况 下 ， 人 允许 两 个 进程 之 间 
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”只 有 单一 连接 就 已 经 足够 了 。 但是， 有 些 时 候 ， 期望 用 于 传送 数据 消息 的 信道 和 用 于 传送 
控制 消息 的 信道 是 分 离 和 独立 的 。 文 件 传输 协议 (FTP) 就 是 以 这 种 方式 使 用 两 个 连接 的 标 
准 的 例子 。 男 外 还 有 多 个 并 行 数据 连接 的 情况 。 在 使 用 超 文 本 传输 协议 (HTTP) 1 版 的 一 些 
网 络 浏 览 器 /服务 器 连接 中 所 使 用 的 机 制 就 是 多 个 连接 的 一 个 例子 。 在 该 协议 中 ， 单 个 信道 
只 能 从 服务 器 检索 一 个 对 象 ， 之 后 服务 器 将 关闭 对 应 连接 3 为 了 加 快 进程 的 运行 效率 ,浏览 
器 往往 会 检索 主页 、 对 其 进行 解析 并 试图 从 中 查找 需要 显示 相应 页 面 的 其 他 元 素 ， 从 而 接 下 
来 会 打开 尽 可 能 多 的 连接 ， 准 确 地 讲 是 ， 每 当 有 对 象 要 检索 时 就 再 打开 一 个 连接 。( 实 际 上 ， 
客户 端 往 往 一 次 只 会 打开 有 限 数量 的 连接 ， 从 而 防止 服务 器 被 拖 垮 和 陶 入 瘫痪 。) 

面向 流 的 通信 或 面向 消息 的 通信 。 对 于 一 些 应 用 程序 而 言 ， 通 信和 链 路 支持 离散 消息 (dis- 
crete message) 的 想法 是 十 分 重要 的 。 负 责 发 送 的 应 用 程序 发 送 一 个 数据 块 ， 并且 该 数据 块 
将 以 相同 的 方式 ( 即 作为 离散 消息 ) 呈现 给 负责 接收 的 应 用 程序 。 这 些 数据 块 可 以 是 固定 长 
度 的 ， 也 可 以 是 可 变 长 度 的 ， 具体 取决 于 相应 的 实现 。 其 他 的 应 用 程序 则 不 识别 数据 中 的 
块 ， 而 是 把 对 应 通信 看 作 是 从 发 送 方 流向 接收 方 的 数据 流 (stream)s 一 个 简单 的 例子 如 远程 
登录 客户 端 应 用 程序 。 用 户 在 键盘 上 点 击 的 每 个 按键 将 会 从 客户 端 直接 发 送 给 服务 器 ， 而 不 
考虑 对 应 的 内 容 是 什么 。 某 些 按键 (例如 ，CTL/C) 的 处 理 可 能 会 优先 于 其 他 的 按键 ,并 且 
有 关 协 议 可 以 将 许多 按键 捆绑 到 一 起 进行 传输 ， 从 而 使 传输 开销 最 小 化 。 不 过 ， 一 般 而 言 ， 
这 些 按键 是 作为 连续 的 信息 流 进行 发 送 的 。 

异 构 通信 或 同 构 通信 。 一 些 通信 系统 往往 假设 消息 的 发 送 者 和 接收 者 是 运行 在 相同 类 
型 的 硬件 和 相同 的 操作 系统 平台 上 的 。 最 鲜明 的 情况 是 ， 假 设 两 个 通信 进程 运行 在 同一 台 机 
器 上 。 而 其 他 的 通信 系统 则 没有 做 出 这 样 的 假设 = 为 此 ,后 一 类 通信 系统 可 能 需要 尝试 处 理 
与 信息 表示 相关 的 一 系列 问题 。 因 为 ， 不 同 的 系统 是 以 不 同 的 格式 来 存储 信息 的 。 通 常情 况 
下 ， 这 是 出 于 硬件 方面 的 考虑 ， 比 如 说 整数 的 存储 。 在 英特尔 80X 86 ( Intel 80 X 86 ) 系列 
硬件 平台 上 ， 数 的 最 高 有 效 字 节 (Most Significant Byte，MSB ) 被 存放 在 较 高 地 址 的 存储 器 
单元 中 。 但 在 大 多 数 其 他 的 硬件 平台 上 , 数 的 最 高 有 效 字 节 则 被 存放 在 较 低地 址 的 存储 器 单 
元 中 。( 这 被 称 为 “小 端 字 节 序 /大 端 字 节 序 ” 问 题 、 即 “little endian/big endian ”问题 ， 相 
关 提 法 源 自 于 《 格 列 佛 游记 》 的 有 关 故 事 。) 如 果 一 个 系统 在 可 能 以 不 同 格式 实现 整数 的 平 
台 之 间 发 送 消息 ， 那 么 该 系统 或 许 想 以 一 种 通用 的 方式 来 解决 有 关 问 题 。 例如 ， 一 个 通过 远 
程 过 程 调用 (Remote Procedure Call，RPC ) 方式 进行 调用 的 子 例 程 可 能 需要 针对 相关 参数 
执行 算术 运算 ， 因 此 发 送 方 和 接收 方 将 需要 以 对 应 用 程序 透明 的 方式 来 解决 这 一 问题 。 另 一 
方面 ， 文 件 传输 协议 (FTP) 例 程 只 是 用 来 对 文件 进行 传输 的 。 相 关内 容 的 重新 编排 并 不 是 
通信 机 制 所 关注 的 方面 。 尽 管 如 此 ， 文 件 传 输 协 议 例 程 可 能 需要 考虑 文件 命名 约定 的 差异 。 
也 就 是 说 ， 在 发 送 方 系统 上 的 一 个 文件 的 和 名称 可 能 并 非 是 接收 方 系统 上 的 一 个 合法 的 文件 
名 。 还 有 一 些 关 于 格式 编排 问题 的 例子 没有 涉及 硬件 ， 而 是 与 相应 的 编程 实现 语言 有 关 。 例 
如 ， 字 符 串 可 能 在 C 语言 中 以 这 种 方式 进行 存放 ， 但 在 BASIC 语言 中 则 以 另 一 种 方式 进行 
存放 ， 因此， 拥有 不 同 语言 编写 的 组 件 的 系统 可 能 必须 得 在 这 些 格 式 之 间 进 行 数据 的 转换 。 
(当然 ， 这 种 问题 无 论 是 对 于 运行 在 单个 处 理 器 上 的 单个 程序 ， 还 是 对 于 多 个 进程 ， 都 是 可 
能 的 。) 还 有 可 能 遇 到 的 另 一 个 问题 是 ， 一 条 消息 的 某 个 参数 有 可 能 是 一 个 内 存 地 址 一 一 如 
可 能 是 指向 某 个 错误 例 程 的 指针 。 显 然 ， 如 果 这 样 的 参数 被 直接 传递 到 了 在 另 一 个 平台 上 运 
行 的 进程 ， 该 参数 将 是 毫 无 意义 的 。 如 果 我 们 想 要 把 内 存 地 址 作为 参数 进行 传递 ， 我 们 将 必 
须 创 建 某 种 其 他 的 通信 机 制 来 予以 相应 的 支持 。 
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同步 通信 或 异步 通信 。 对 于 大 多 数 高 级 语言 而 言 ， 当 程序 从 一 个 文件 中 读 取 记录 时 ， 有 
关 功 能 所 对 应 的 模型 通常 是 ， 在 下 一 条 指令 被 执行 时 ， 相 应 的 读 操作 已 经 完成 。 这 种 输 
入 /输出 模型 称 为 同步 输入 /输出 (synchronous 1/0) 或 阻塞 式 输入 /输出 (blocking 1/0)。 
如 果 一 个 进程 在 执行 读 操作 的 同时 还 要 参与 完成 其 他 的 任务 ， 那 么 该 进程 可 以 选择 以 异步 
(asynchronous) 读 取 方式 或 非 阻 塞 式 (nonblocking) 读 取 方式 来 发 出 读 操作 请 求 。 在 这 种 情 
况 下 ， 读 操作 指令 将 立即 返回 到 对 应 程序 ， 并 且 读 操作 将 会 独立 地 执行 。 最 终 ， 程 序 将 会 探 
询 有 关 读 操作 是 否 已 经 完成 ， 具 体 方法 取决 于 相应 的 程序 设计 语言 和 操作 系统 。 通 信 信 道 也 
是 类 似 的 。 一 个 进程 可 能 想 要 检查 某 信 道 找 寻 消 息 ， 但 是 如 果 没 有 可 用 消息 ， 该 进程 会 继续 
执行 。 因 此 ， 对 于 某 些 通信 机 制 而 言 ， 一 个 接收 进程 可 以 发 出 一 个 针对 相应 信道 的 异步 读 操 
作 请 求 ， 并 且 如 果 没 有 信息 要 读 取 ， 那么 操作 系统 将 带 着 一 个 表征 没有 数据 传送 的 结果 从 该 
调用 返回 且 该 进程 将 不 会 等 待 。 类 似 地 ， 如 果 没 有 缓冲 空间 可 以 用 来 接收 有 关 的 消息 ， 一 个 
异步 写 操作 请 求 也 可 能 会 被 拒绝 和 抛弃 。 

持久 通信 或 瞬时 通信 。 在 最 简单 的 情况 下 ， 发 送 进 程 和 接收 进程 必须 同时 运行 以 便于 它 
们 交换 消息 。 如 果 其 中 一 个 进程 不 可 利用 ,那么 相应 通信 系统 便 无 法 正常 运作 。 这 种 类 型 的 
机 制 称 为 瞬时 通信 。 在 其 他 的 系统 中 ， 操 作 系统 将 会 保留 发 给 一 个 当前 并 不 运行 的 进程 的 那 
些 消息 ， 或 者 会 传送 由 一 个 当前 并 不 运行 的 进程 所 发 出 的 那些 消息 。 这 样 的 通信 服务 称 为 持 
久 通信 。 


9.2.2 ”进程 间 通 信 系 统 的 例子 


在 最 简单 的 情况 下 ， 一 个 发 送 进程 可 能 只 需要 传递 一 个 最 少数 量 的 信息 ， 即 一 个 二 进 制 
位 ， 其 一 般 用 来 表征 某 事件 已 经 发 生 。 对 于 这 种 情况 ， 相 关 进 程 可 以 利用 下 一 节 中 将 要 描述 
的 同步 机 制 。 然 而 ， 在 大 多 数 情况 下 ， 进 程 需要 发 送 比 单个 二 进 制 位 更 多 的 信息 ， 因 此 它们 
将 使 用 更 为 精巧 的 机 制 ， 即 进程 间 通 信 ( InterProcess Communication，IPC) 系统 来 发 送 整 
个 消息 。 

一 种 被 广泛 使 用 的 进程 之 间 消 息 交 换 的 方法 是 管道 (pipe) 的 运用 。 管 道 本 质 上 就 是 一 
个 循环 缓冲 (或 循环 队列 )， 并 且 一 个 进程 把 数据 放 人 其 中 ， 而 另 一 个 进程 从 中 取出 数据 。 
这 两 个 进程 可 以 利用 系统 调用 来 放置 和 提取 数据 。 这 种 机 制 使 有 关 进 程 无 须 再 去 担忧 同步 问 
题 。( 我 们 很 快 将 会 讨论 这 一 问题 的 本 质 。) 操作 系统 将 会 寻找 一 个 放 有 消息 的 所 谓 满 的 缓冲 
区 或 者 一 个 没有 有 效 消息 的 所 谓 空 的 缓冲 区 ， 不 过 主 调 例 程 需要 意识 到 相应 调用 可 能 没有 成 
功 。 例 如 ， 如 果 对 应 缓冲 区 已 满 ， 那 么 尝试 将 数据 放 人 该 缓冲 区 的 发 送 例 程 将 会 被 阻塞 。 通 
常情 况 下 ， 一 个 接收 例 程 可 以 调用 非 阻塞 式 系统 例 程 来 尝试 从 缓冲 区 中 读 取 数 据 。 如 果 有 数 
据 可 用 ， 则 将 对 应 数据 返回 。 而 如 果 缓 冲 区 中 没有 数据 ， 那 么 对 应 调用 也 将 立即 返回 ,但 会 
有 一 个 返回 码 用 来 指示 没有 消息 被 读 取 到 。 往 往 还 会 有 阻塞 式 类 型 的 读 操作 。 如 果 一 个 接收 
者 除了 等 待 传人 的 信息 之 外 而 无 其 他 事项 可 做 ， 该 接收 者 就 可 以 使 用 阻塞 式 读 操 作 。 管 道 最 
初出 现在 UNIX 系统 中 ， 并 且 在 UNIX 和 Linux 系统 中 ， 管 道 是 字 节 流 而 不 是 离散 消息 ， 同 
时 相应 管道 是 单 向 的 信道 。 在 Windows 系统 实现 中 ， 管 道 可 以 是 字 节 流 ， 但 是 它们 也 可 以 
用 于 发 送 消 息 ， 并 且 相 应 管道 是 双向 的 。 

关于 管道 的 另 一 个 问题 是 如 何在 一 开始 对 它们 进行 设置 的 问题 。 在 某 些 情况 下 ， 发 送 进 
程 和 接收 进程 必须 都 有 明确 的 名 字 来 辨别 对 方 。 这 在 通常 情况 下 是 不 受 欢迎 的 ， 因 为 与 其 他 
方法 相 比 ， 这 将 更 难以 实现 和 维护 。 而 有 些 时 候 ， 接 收 者 可 能 并 不 在 乎 谁 正 在 发 送 ， 但 发 送 
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者 必须 明确 指定 接收 者 。 一 个 把 消息 写 入 日 志文 件 的 应 用 程序 可 能 会 同时 向 多 个 客户 端 提供 
此 项 服务 。 该 应 用 程序 将 会 接收 到 关于 是 哪个 客户 端 发 送 消息 的 一 个 标示 信息 ， 并 且 还 可 以 
把 相关 信息 记录 到 日 志 中 。 还 有 一 些 时 候 ， 发 送 方 提供 的 不 是 接收 进程 的 名 字 ， 而 是 关于 接 
收 进程 的 某 种 其 他 的 引用 标记 ， 这 有 时 被 称 为 邮箱 (mailbox)。 在 这 种 情况 下 ， 发 送 者 正在 
寻找 一 种 可 以 由 许多 不 同 进 程 所 提供 的 服务 ， 并 且 发 送 者 并 不 介意 哪 一 个 进程 在 提供 相应 服 
务 。 命 名 管道 (named pipe) 是 此 类 机 制 的 一 个 例子 。 

现在 ， 套 接 字 (socket) 机 制 已 经 使 用 有 很 长 一 段 时 间 了 ， 因 此 ， 这 种 机 制 的 优势 之 一 
就 是 拥有 许多 兼容 性 的 实现 一 一 套 接 字 机 制 几乎 在 每 种 操作 系统 上 都 有 实现 和 都 可 以 使 用 。 
套 接 字 是 专门 被 设计 在 标准 网 络 层 上 运行 的 。 在 大 多 数 情况 下 ， 这 一 层 的 下 面 是 网 际 协议 
(Internet Protocol，IP)， 而 上 面 为 传输 控制 协议 ( Transmission Control Protocol，TCP) 或 
用 户 数 据 报 协议 ( User Datagram Protocol，UDP)， 不 过 也 存在 其 他 的 实现 。 客 户 端 (发 送 
方 ) 主机 需 指定 服务 器 (接收 方 ) 主机 的 名 字 ， 同 时 还 应 指定 在 接收 方 主机 上 的 特定 的 套 接 
字 (有 时 称 为 端口 )。 这 些 只 是 逻辑 意义 上 的 指定 ， 而 不 是 对 硬件 端口 的 引用 。 在 许多 情况 
下 ， 这 个 套 接 字 将 会 是 一 个 众所周知 的 数 。 大 家 都 很 熟悉 的 套 接 字 (在 1024 以 下 ) 常常 已 
经 被 有 关 标 准 化 组 织 分 配给 了 相关 的 标准 化 协议 。 而 较 大 的 套 接 字 编 号 则 被 预 留用 于 未 被 标 
准 化 的 应 用 程序 。 当 客户 端 尝 试 连接 到 相应 的 服务 器 时 ， 客 户 端 将 会 被 分 配 一 个 套 接 字 编 号 
以 供 其 所 使 用 。 与 用 于 管道 中 相对 简单 的 单 向 缓冲 机 制 不 同 ， 套 接 字 支持 更 为 复杂 精细 的 模 
型 。 一 旦 客户 端 和 服务 器 之 间 建 立 了 连接 , 那么 它们 所 使 用 的 协议 将 会 由 对 应 的 应 用 程序 来 
决定 。 无 论 是 客户 端 还 是 服务 器 都 可 以 在 任何 时 间 发 送 消息 。 对 于 某 些 应 用 程序 来 说 ， 应 用 
层 协议 是 已 被 标准 化 的 ， 但 是 ， 新 的 应 用 程序 可 以 设计 其 所 需要 的 任何 类 型 的 协议 。 应 用 程 
序 还 可 以 将 现 有 的 协议 用 于 各 种 不 同 的 目的 。 例 如 ， 应 用 程序 通常 都 支持 超 文 本 传输 协议 ， 
因为 许多 防火 墙 都 被 设置 为 放行 这 种 协议 的 信息 流 。 通 常情 况 下 ， 服 务 器 则 通过 执行 一 系列 
操作 系统 调用 来 创建 套 接 字 ， 然 后 开始 等 待 与 相应 套 接 字 的 传人 连接 。 而 如 果 服 务 器 提供 了 
诸如 文件 传输 协议 之 类 的 复杂 服务 ， 那 么 服务 器 往往 会 启动 一 个 单独 的 线程 来 负责 处 理 与 每 
个 客户 端 之 间 的 交互 。 但 如 果 相 关 的 服务 非常 简单 ， 壁 如 说 只 是 提供 当日 报价 的 服务 ， 那么 
服务 器 可 以 只 是 发 送 一 条 消息 ， 然 后 就 可 以 中 断 对 应 连接 。 

套 接 字 设 计 的 男 一 个 优点 是 ， 服 务 器 端 和 客户 端 可 以 位 于 同一 台 机 器 上 。 这 在 开发 新 的 
应 用 程序 时 特别 方便 。 同 时 ， 这 也 意味 着 同样 的 程序 ， 无 须 对 任何 程序 (无 论 是 客户 端 程序 
还 是 服务 器 端 程序 ) 进行 任何 的 修改 ， 就 能 既 可 以 为 本 地 的 客户 端 提供 服务 ， 还 可 以 为 远程 
的 客户 端 提 供 服 务 。 这 是 一 个 非常 整洁 干净 的 模型 ， 没有 其 他 机 制 的 某 些 复杂 性 。 当 然 ， 这 
也 意味 着 ， 对 于 本 地 的 客户 端 来 说 ， 正 在 完成 的 大 量 的 工作 并 不 是 必需 的 。 如 果 要 考虑 性 能 
问题 ， 并 且 对 应 系统 始终 是 在 同一 台 机 器 上 运行 客户 端 和 服务 器 端 ， 那 么 应 当 使 用 更 为 高 效 
的 机 制 。 

一 种 持久 的 通信 机 人 制 称 为 消息 队列 ( message queuing)。 此 类 系统 往往 会 创建 被 指定 名 
字 的 消息 队列 。 具 体 而 言 ， 一 个 希望 把 消息 写 入 队列 的 进程 将 执行 有 关 的 操作 系统 调用 ， 同 
时 传 入 消息 和 用 于 放 入 消息 的 队列 的 名 称 作为 相应 的 参数 。 而 一 个 希望 从 队列 读 取 消息 的 进 
程 同样 也 需要 执行 有 关 的 操作 系统 调用 ， 同 时 传人 一 个 空 的 缓冲 区 和 对 应 队列 的 名 称 作为 参 
数 。 这 两 类 进程 可 以 同时 运行 ， 也 可 以 不 是 同时 运行 的 。 其 他 的 进程 或 系统 实用 程序 通常 被 
用 来 创建 和 销毁 相应 的 消息 队列 。 这 些 队 列 经 常 被 保存 在 辅助 存储 器 中 ， 从 而 确保 其 持久 
性 ， 因 此 这 种 通信 机 制 的 管理 开销 也 是 很 大 的 。 
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9.2.3 共享 内 存 系统 的 例子 

对 于 许多 操作 系统 而 言 ， 在 同一 台 机 器 上 运行 的 两 个 (或 多 个 ) 进程 有 可 能 会 要 求 操作 
系统 允许 它们 共享 访问 某 一 内 存 块 ， 这 种 技术 被 称 为 共享 内 存 (shared memory )。 相 关内 存 
共享 实施 过 程 通常 是 这 样 的 ， 一 个 进程 调用 操作 系统 以 请 求 分 配 ( 某 指定 长 度 的 ) 一 段 内 存 ， 
并 获得 相应 内 存 分 段 的 一 个 名 字 。 而 其 他 希望 共享 此 段 内 存 的 进程 必须 要 知道 该 内 存 分 段 的 
名 字 ， 且 有 关 进 程 通过 向 操作 系统 提供 这 一 内 存 分 段 名 字 来 请 求 访问 对 应 内 存 分 段 。 所 有 相 
关 进 程 的 内 存 地 址 设置 应 当 予 以 相应 的 调整 ， 以 便 它 们 可 以 访问 对 应 的 共享 内 存 块 。 这 一 机 
制 的 确切 内 容 将 在 第 11 章 中 具体 讨论 。 此 外 ， 一 些 应 用 程序 非常 简单 ， 并 不 需要 复杂 的 同 
步 操作 来 确保 相关 两 个 进程 不 会 相互 和 干扰。 但是， 也 有 一 些 其 他 的 系统 则 可 能 需要 更 为 复杂 
和 精巧 的 同步 机 制 来 控制 对 指定 共享 内 存 块 中 的 数据 的 访问 ， 这 一 主题 及 相关 内 容 将 在 下 一 
节 中 详细 阐述 。 需 要 注意 的 是 ,虽然 独立 的 进程 之 间 必 须 使 用 此 类 复杂 精巧 的 机 制 来 实现 内 
存 的 共享 ， 但 是 根据 定义 ， 同 一 进程 中 的 线程 之 间 则 始终 可 以 共享 它们 的 内 存 。 

内 存 映射 文件 ( memory mapped file) 是 共享 内 存 的 一 种 特例 ， 这 是 对 共享 内 存 技术 的 
一 种 轻微 的 改动 。 具 体 来 说 ， 首 先 ， 发 起 者 进程 调用 操作 系统 ， 同 时 传人 辅助 存储 器 上 的 一 
个 文件 的 名 字 作 为 参数 。 然 后 ， 操 作 系统 查找 定位 对 应 文件 ， 并 在 主 调 进 程 中 分 配 空间 使 其 
包含 整个 文件 。 尽 管 如 此 ， 该 文件 并 不 会 立即 加 载 到 内 存 中 。 当 共享 文件 的 某 些 部 分 第 一 次 
被 访问 的 时 候 ， 硬 件 将 会 发 信号 通知 操作 系统 ， 从 而 把 文件 的 相应 部 分 加 载 到 内 存 中 ， 并 恢 
复 对 应 进程 的 运行 。 这 种 机 制 将 在 第 11 章 中 展开 更 为 全 面 详尽 的 描述 。 


9.3 同步 
9.3.1 相关 问题 


关于 为 什么 进程 需要 通信 以 及 它们 可 以 用 来 通信 的 一 些 机 制 ， 我 们 现在 已 经 有 了 一 定 的 
认识 。 接 下 来 ,我们 将 把 注意 力 转移 到 当 两 个 进程 想 要 共享 内 存 中 的 一 块 数据 时 可 能 发 生 的 
问题 上 来 。 考 虑 下 面 的 例子 ， 有 两 个 进程 A 和 B， 它 们 正在 使 用 一 个 缓冲 区 进行 通信 并 尝 
试 更 新 一 个 共享 记录 计数 器 (初始 值 为 8)。 进 程 A 把 一 条 记录 放 入 缓冲 区 中 ， 并 试图 通 
过 对 无 的 加 1 操作 来 使 共享 记录 计数 器 递增 。 进程 B 则 从 缓冲 区 中 提取 一 条 记录 ， 故 而 它 
应 试图 通过 对 六 的 减 1 操作 来 使 共享 记录 计数 器 递减 。 为 此 ， 进 程 A 拥有 一 条 指令 和 Xl1， 
同时 进程 B 拥有 一 条 指令 X=X=1。 当 进程 A、B 顺 次 执行 记录 放 信 操作、 记录 提取 操作 以 及 
这 两 条 指令 执行 后 ， 我 们 期 望 下 的 最 终 取 值 仍然 为 8。 然 而， 这 里 存在 一 个 潜在 的 小 问题 。 

通常 情况 下 ， 上 面 我 们 所 说 明 的 两 条 高 级 语言 命令 可 分 别 分 解 成 三 条 独立 的 机 器 指令 ， 
即 寄存 器 加 载 指令 、 加 法 或 减法 指令 以 及 存储 指令 。 考 虑 图 9-1 所 示 的 执行 过 程 。 首 先 ， 进 
程 A 将 变量 蕊 的 取 值 加 载 到 寄存 器 A 中 ， 于 是 ， 寄 存 器 A 中 就 包含 了 数值 8。 这 时 候 ， 假 
定 进程 A 因为 自己 的 时 间 片 已 经 用 完 所 以 被 中 断 。 相 关 寄 存 器 内 容 被 保存 在 进程 A 的 进程 
控制 块 中 。 此 时 ,进程 B 获得 了 一 个 时 间 片 ， 故 而 将 变量 元 的 取 值 加 载 到 寄存 器 A 中 。 为 
此 ， 寄存 器 A 的 内 容 同 刚才 进程 A 的 操作 结果 相 比 并 没有 发 生 任何 改变 。 接 下 来 ， 进 程 B 
从 寄存 器 A 的 内 容 中 减 去 1， 从 而 使 之 变 成 了 7， 然后 将 其 存放 在 变量 也 对 应 的 内 存单 元 
中 ;这样 就 使 变量 式 取 值 成 为 7。 进程 B 继续 去 执行 其 他 的 操作 。 最 终 ， 进 程 A 会 被 再 次 
调度 和 获得 另 一 个 时 间 片 。 进 程 A 的 寄存 器 的 内 容 根据 其 进程 控制 块 进行 了 恢复 ， 故 而 现 
在 寄存 器 A 的 内 容 再 次 变 成 了 8。 进 程 A 对 寄存 器 A 执行 加 1 操作 ， 从 而 得 到 9， 然 后 将 
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其 存放 在 变量 已 对 应 的 内 存单 元 中 ,这 样 就 使 变量 X 取 值 变 成 了 9。 显然 ,这 根本 不 是 我 们 
所 期 望 的 最 终结 果 。 更 为 糟糕 的 是 ， 这 一 问题 是 与 时 序 相 关 的 。 也 就 是 说 ， 存 在 一 个 非常 小 
的 时 间 和 窗口， 期 间 才 可 能 发 生 此 类 问题 ， 而 几乎 所 有 的 时 间 ， 这 两 个 进程 都 会 非常 融洽 和 恰 
到 好 处 地 共享 这 个 变量 ， 假 设 这 是 它们 对 该 变量 所 做 的 唯一 的 修改 。 这 种 问题 因为 其 间歇 性 
特征 ， 所 以 很 难 调试 ， 称 之 为 竞 态 条 件 (race condition)。 进 一 步 说 ， 竞 态 条 件 ， 或 称 为 竞 
争 险 象 (race hazard)， 是 指 设计 方面 的 一 个 缺陷 ， 相 关系 统 输出 取决 于 其 他 事件 的 次 序 或 时 
序 。 对 于 多 处 理 器 系统 而 言 ， 当 进程 A 运行 在 一 个 处 理 器 上 而 进程 B 运行 在 另 一 个 处 理 器 
上 时 ， 此 类 问题 也 可 能 发 生 。 无 论 是 什么 原因 导致 了 这 类 问题 ， 我 们 都 需要 一 种 解决 方案 。 
虽然 多 处 理 器 系统 在 高 端 服务 器 之 外 并 不 常见 ,但 是 在 单个 芯片 内 拥有 多 个 处 理 器 已 经 成 为 
当前 这 一 代 处 理 器 芯片 的 焦点 。 因 此 ， 这 类 问题 将 变 得 更 为 普遍 。 


X=8 





9.3.2 原子 操作 


我 们 所 需要 的 技巧 是 让 那些 操作 原子 化 (atomic)。 原 子 化 意味 着 我 们 所 做 的 操作 是 不 
可 分 割 的 一 一 特别 地 ， 该 操作 不 能 被 想 要 更 新 同一 信息 的 另 一 个 进程 所 打 断 。 一 种 可 能 的 解 
决 方案 是 把 对 应 指令 编译 成 一 条 不 可 被 中 断 的 指令 。 例 如 ， 一 些 机 器 可 以 对 内 存 中 的 某 个 变 
量 执行 加 1 (或 减 1 ) 操作 而 不 用 把 对 应 变量 加 载 到 寄存 器 中 。 但 是 ， 当 我 们 用 高 级 语言 
写 我 们 的 程序 时 ， 我 们 常常 不 想 为 这 样 的 硬件 细节 所 挂 虑 。 我 们 往往 希望 能 够 把 我 们 的 程序 
移 到 一 台 不 同 的 可 能 没有 此 类 指令 的 机 器 上 。 因 此 ， 我 们 必须 得 使 用 一 种 更 为 通用 的 解决 
方案 。 


9.3.3 ” 锁 与 临界 区 


有 时 ， 我 们 的 进程 只 是 在 共享 一 个 变量 ， 而 有 时 ， 它 们 则 共享 着 一 个 较为 复杂 精巧 的 
结构 。 有 时 ， 我 们 只 是 在 执行 单一 的 操作 ， 而 有 时 ， 我 们 则 会 执行 较为 复杂 的 多 个 操作 。 有 
时 ， 我们 仅仅 有 两 个 进程 试图 去 共享 一 个 资源 ， 而 有 时 ， 我 们 则 会 有 很 多 进程 在 共享 一 个 资 
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源 。 有 时 ， 我们 在 尝试 共享 一 个 拥有 多 个 实例 的 资源 ， 而 有 时 ， 我 们 则 在 尝试 共享 一 个 拥有 
仅仅 一 个 实例 的 资源 。 我 们 将 要 使 用 的 这 种 通用 的 


技术 就 是 ， 用 一 种 称 为 锁 ( lock) 的 特殊 类 型 的 变 确保 对 应 锁 是 打开 的 */ 
量 来 控制 对 共享 变量 的 访问 。 锁 有 时 也 被 称 为 互 斥 操纵 处 理 被 共享 的 数据 */ 


机 制 (mutex)， 因 为 它 可 以 提供 对 锁 保 护 下 的 数据 人 
项 的 互 斥 访问 。 当 我 们 审视 一 个 使 用 锁 的 进程 时 ， 
我 们 可 以 认为 相应 的 程序 拥有 4 个 部 分 ， 如 图 9-2 
所 示 。 

具体 而 言 ， 临 界 区 (critical section) 是 指 对 应 进程 中 用 于 操纵 处 理 那些 可 能 也 被 其 他 进 
程 所 操纵 处 理 的 信息 的 代码 部 分 。 进 入 区 (entry section) 是 指 对 共享 信息 上 锁 的 代码 一 一 其 
首先 确认 没有 其 他 进程 当前 正在 其 临界 区 内 ， 然 后 锁 上 锁 ， 从 而 保证 没有 任何 其 他 共享 对 应 
信息 的 进程 现在 可 以 进入 到 其 临界 区 内 。 退 出 区 (exit section) 是 指 在 对 应 进程 执行 结束 临 
界 区 代码 之 后 的 打开 锁 的 代码 。 剩 余 区 ( remainder section) 则 是 对 应 进程 的 其 余 代 码 部 分 。 
注意 这 个 进程 可 能 还 包含 其 他 的 临界 区 和 锁 。 这 里 的 描述 只 是 审视 关于 单个 锁 操作 的 各 组 成 
部 分 的 一 种 结构 化 的 方法 。 这 种 结构 的 效果 是 ,我 们 可 以 让 我 们 正在 执行 的 针对 被 共享 信息 
的 操作 原子 化 。 换 句 话 说 ,没有 其 他 想 要 操纵 这 一 共享 信息 的 任何 进程 可 以 中 断 该 临界 区 。 
但 是 ， 这 一 结构 并 不 是 去 防止 对 应 进程 (为 方便 起 见 ， 这 里 不 妨 假设 对 应 进程 为 进程 A) 被 
中 断 。 这 意味 着 ， 如 果 对 应 进程 A 被 中 断 ， 其 他 任何 试图 进入 其 临界 区 (对 应 于 这 个 变量 ) 
的 进程 将 会 被 迫 等 待 ， 直 到 对 应 进程 A 结束 完成 其 退出 区 代码 。 


9.3.4 ”硬件 锁 指令 


关于 进入 区 和 退出 区 的 代码 编写 ， 可 以 采用 许多 方案 。 对 于 非常 简单 的 骨 人 式 操作 系 
统 或 者 在 操作 系统 的 内 核 中 ， 我 们 可 以 使 用 一 些 特殊 的 机 器 指令 来 完成 上 锁 和 开锁 。 这 些 指 
令 本 身 就 是 原子 指令 ， 且 只 有 为 数 不 多 的 几 种 常见 的 变种 。 其 中 有 一 种 是 测试 - 设置 ( Test 
and Set) 指令 ， 这 种 指令 将 会 把 内 存 中 的 一 个 变量 设置 为 非 零 值 ( 即 实施 上 锁 操作 )， 同 时 返 
回 一 个 结果 以 告诉 我 们 在 我 们 执行 这 条 指令 之 前 是 否 已 经 上 锁 。 如 果 在 我 们 执行 这 条 指令 之 
前 已 经 上 锁 ， 那 么 我 们 就 没有 获得 访问 被 锁定 的 临界 区 的 权限 ， 所 以 我 们 只 好 重新 尝试 这 一 
操作 指令 : 

while (TestAndSset(MyLock)) ; 


注意 ， 这 里 while 循环 语句 的 循环 体 是 空 的 ， 所 以 这 个 循环 的 内 部 实际 上 并 不 会 执行 任 
何 操作 ， 直 到 当 该 指令 执行 返回 未 上 锁 的 结果 时 才 会 终止 循环 。 这 种 类 型 的 编码 有 时 被 称 为 
自 旋 锁 ( spin-lock) 或 忙 等 待 ( busy-waiting)。 另 一 种 常见 的 原子 指令 是 对 换 ( swap) 指令 ， 
该 指令 可 以 在 一 步 里 完成 两 个 变量 取 值 的 交换 。 从 对 换 指 令 可 以 把 任何 值 放 和 人 锁 变 量 的 意义 
上 来 看 ， 这 一 指令 的 功能 比 测试 - 设置 指令 要 稍微 强大 一 些 。 除 此 之 外 ， 二 者 是 等 效 的 。 还 
有 另外 一 种 类 似 的 指令 称 为 取 -加 (fetch-and-add) 指令 ， 该 指令 从 内 存 中 获取 一 个 用 作 锁 
的 整数 ， 同 时 针对 该 整数 执行 加 1 操作 并 将 其 写 回 到 同一 内 存 位 置 。 从 80486 处 理 器 起 ,在 
英特尔 处 理 器 中 已 经 开始 使 用 以 这 种 方式 运作 的 XADD 指令 了 。 选 择 这 些 原子 指令 的 哪 一 
种 进行 实现 ， 具 体 取 决 于 硬件 设计 问题 。 如 果 采 用 前 两 种 指令 ,我 们 的 进程 的 退出 区 将 只 需 
把 对 应 的 锁 变量 设置 为 假 ( 即 零 ) 即 可 。 而 通常 情况 下 ， 把 零 值 存 人 内 存 位 置 在 任何 硬件 上 
都 是 一 条 原子 指令 。 





图 9-2 一 个 操控 共享 内 存 的 进程 的 组 成 
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9.3.5 ”信号 量 与 等 待 


如 果 一 个 进程 真 的 包含 了 上 面 我 们 所 给 出 的 使 用 测试 - 设置 指令 的 while 循环 ， 那 么 在 
其 等 待 的 过 程 中 ， 将 会 是 在 浪费 处 理 器 周期 。 因 此 ， 在 大 多 数 情况 下 ， 应 用 程序 往往 不 会 使 
用 这 些 指 令 来 实现 有 关 的 进入 区 代码 。 进 一 步 说 ， 对 于 进入 区 和 退出 区 的 代码 设计 来 说 ， 应 
用 程序 常常 会 采用 操作 系统 调用 请 求 的 方式 。 通 常情 况 下 ， 在 这 些 调用 中 所 使 用 的 变量 被 声 
明 为 信号 量 (semaphore)。 与 我 们 已 经 描述 的 简单 的 锁 机 制 相 比 ， 信 号 量 可 能 要 更 为 复杂 一 
些 。 锁 机 制 永远 是 二 值 状态 ， 但 信号 量 通常 要 更 为 一 般 化 。 鉴 于 此 ， 简 单 的 信号 量 经 常 被 称 
为 二 值 型 信号 量 (binary semaphore)， 并 且 只 支持 互 斥 访问 锁定 功能 。 

虽然 不 同 的 操作 系统 和 语言 对 这 些 例 程 往往 会 使 用 许多 不 同 的 名 称 ， 但 一 般 来 讲 ， 关 于 
进入 区 的 系统 调用 可 以 采用 如 下 简单 的 形式 : 


wait (MySemaphore) 


而 退出 区 的 系统 调用 则 为 : 


signal (MySemaphore) 


当 我 们 调用 wait 例 程 时 ， 如 果 被 锁定 的 资源 不 可 用 ， 那么 操作 系统 不 是 将 我 们 的 进程 
置 于 循环 过 程 ， 而 是 使 我 们 的 任务 脱离 运行 状态 并 将 其 置 为 等 待 状态 。 于 是 ， 该 进程 只 有 等 
待 ， 一 直到 对 应 锁 被 打开 为 止 。 进 一 步 说 ， 当 现在 进入 对 应 临界 区 的 任务 通过 其 退出 区 并 针 
对 我 们 正在 等 待 的 对 应 锁 执行 signal 系统 调用 时 ， 这 一 情况 将 会 发 生 。 此 时 ， 操 作 系 统 将 让 
我 们 的 任务 离开 等 待 状态 ， 并 将 其 置 为 就 绪 状 态 。 随 后 ， 操 作 系统 将 会 赋予 我 们 的 任务 进入 
临界 区 和 上 锁 的 权利 ， 同 时 防止 其 他 试图 进入 同一 临界 区 的 任务 闻 入 临界 区 中 。 正 如 我 们 前 
面 所 提 到 的 ， 可 能 有 任意 数量 的 任务 在 等 待 同一 个 锁 ， 所 以 操作 系统 可 能 需要 一 个 队列 用 于 
存放 等 待 每 个 信号 量 的 所 有 任务 。 


9.3.6 ”计数 型 信号 量 


然而 ， 更 为 常见 的 情况 是 ， 每 个 信号 量 经 常会 关联 有 一 个 正 整 数 的 计数 器 。 这 样 的 信 
号 量 有 时 被 称 为 计数 型 信号 量 ( counting semaphore)。 它 们 通常 用 来 控制 针对 一 组 同类 资源 
(例如 缓冲 区 中 的 记录 ) 的 访问 。 与 计数 型 信号 量 相关 联 的 计数 器 一 般 被 初始 化 为 相应 可 用 
资源 的 数量 。 在 应 用 程序 中 ， 关 于 计数 型 信号 量 所 使 用 的 代码 通常 与 关于 二 值 型 信号 量 所 使 
用 的 代码 是 相同 的 。 当 一 个 进程 想 要 访问 某 类 资源 的 一 个 实例 时 ， 它 会 调用 如 前 所 述 的 wait 
例 程 。 如 果 与 对 应 信号 量 相关 联 的 计数 器 取 值 为 零 ， 那 么 说 明 对 应 资源 没有 实例 可 以 使 用 ， 
于 是 相应 的 请 求 进程 被 阻塞 。 而 如 果 对 应 的 计数 器 取 值 大 于 零 ， 那 么 说 明 对 应 资源 有 实例 可 
以 使 用 ， 于 是 对 应 计数 器 将 会 递减 以 表明 一 个 实例 正在 使 用 中 。 当 进程 调用 signal 例 程 时 ， 
对 应 的 计数 器 将 会 递增 ， 同 时 相应 的 可 用 资源 将 会 被 分 配给 某 个 正在 等 待 的 进程 。 

计数 型 信号 量 还 可 以 用 于 对 文件 访问 的 同步 ， 其 间 ， 相 关 进 程 往往 会 执行 大 量 的 文件 
读 操作 以 及 少量 的 文件 写 操作 。 一 般 而 言 ， 可 以 允许 许多 只 执行 读 操 作 的 所 谓 读者 进程 同时 
运行 ， 但 是 当 有 进程 试图 写 操作 对 应 文件 时 ,我 们 可 能 并 不 希望 读者 进程 处 于 活动 状态 。 因 
此 , 我们 可 以 采用 计数 型 信号 量 来 支持 多 个 读者 进程 同时 读 操作 文件 ， 且 只 有 当 读 者 进程 的 
计数 值 变 为 零 时 ， 才 会 允许 一 个 包含 写 操 作 的 所 谓 写 者 进程 来 写 操作 相应 文件 。 一 旦 一 个 写 
者 进程 试图 访问 对 应 文件 及 相应 的 锁 ( 译 者 注 : 用 于 实现 写 者 进程 与 其 他 进程 之 间 的 互 斥 访 
问 )， 我 们 将 不 允许 任何 其 他 的 读者 获得 文件 的 访问 权 ， 直 到 对 应 写 者 进程 访问 了 被 锁定 的 
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文件 并 完成 其 工作 为 止 。 


9.3.7 同步 与 流水 线 体系 结构 


当 多 个 处 理 器 存在 于 单个 系统 中 并 且 相 关 处 理 器 具有 流水 线 体系 结构 时 ， 处 理 器 执行 指 
令 的 次 序 可 能 会 发 生 混乱 。 这 便 可 能 导致 诸如 测试 - 设置 指令 之 类 的 同步 指令 出 现时 序 问 
题 。 因 此 ,往往 会 提供 某 种 机 制 以 允许 应 用 程序 (或 操作 系统 ) 发 出 一 种 命令 ,来 限制 处 理 
器 按照 相关 指令 在 程序 中 的 次 序 来 执行 某 一 特定 的 指令 序列 ， 从 而 避免 此 类 问题 的 发 生 。 


9.3.8 对称 多 处 理 系统 中 的 同步 


我 们 曾经 在 前 面 的 章节 中 说 过 ， 计 算 机 系统 发 展 的 趋势 是 包含 多 个 处 理 器 ， 特 别 是 多 
个 处 理 器 被 合并 和 融入 单个 集成 电路 中 的 所 谓 多 核 处 理 器 。 此 类 系统 要 求 操作 系统 能 够 管 
理 多 个 处 理 器 的 资源 。 首 选 的 解决 方案 被 称 为 对 称 多 处 理 架 构 ( Symmetric MultiProcessing， 
SMP)。 在 这 种 体系 结构 中 ， 操 作 系 统 被 设计 为 可 以 运行 在 任何 处 理 器 上 。( 一 种 替代 的 体系 
结构 被 称 为 非 对 称 多 处 理 架构 。 其 中 ， 一 个 处 理 器 上 运行 操作 系统 ， 而 其 他 的 处 理 器 上 则 只 
运行 应 用 程序 。 这 种 架构 现在 已 经 很 少见 到 。) 

在 各 个 独立 的 处 理 器 上 运行 的 操作 系统 的 多 个 执行 流 ， 可 能 会 尝试 同时 引用 相同 的 数 
据 。 为 了 避免 这 种 情况 ， 对 称 多 处 理 操作 系统 将 会 使 用 锁 。 我 们 曾经 说 过 ， 用 户 程 序 并 没 
有 使 用 自 旋 锁 ， 因 为 它们 会 浪费 掉 宝 贵 的 处 理 器 周期 且 相 应 时 间 长 度 未 知 。 然 而 ， 在 操作 
系统 内 部 ， 我 们 大 致 会 知道 我 们 只 会 在 非常 短暂 的 预定 长 度 的 时 间 内 锁定 。 同 时 ， 我 们 无 
法 非常 合理 地 去 执行 一 个 操作 系统 调用 到 wait 例 程 中 ， 因 为 这 时 我 们 已 经 是 在 内 核 中 了 ! 
因此 ， 尽 管 会 浪费 掉 处 理 器 周期 ， 操 作 系统 内 核 代 码 通常 情况 下 还 是 会 使 用 硬件 的 自 旋 锁 
机 制 。 

然而 ， 这 就 带 来 了 一 个 有 趣 的 硬件 问题 。 设 想 一 下 若干 处 理 器 中 的 某 个 处 理 器 希望 将 某 
个 数值 写 人 内 存 中 的 情况 。 大 家 都 知道 ， 为 了 保护 临界 区 ， 会 使 用 一 个 锁 。 同 时 ， 信 和 号 量 是 
存放 在 共享 内 存 中 的 ， 且 每 个 处 理 器 也 可 能 在 其 高 速 缓存 中 拥有 这 一 信号 量 的 数值 。 或 许 你 
已 经 能 够 看 到 问题 了 一 一 现在 ， 有 很 多 的 处 理 器 在 使 用 那些 相同 的 原子 指令 ， 并且 很 可 能 是 
同时 使 用 。 这 便 要 求 在 对 称 多 处 理 架构 中 ， 共 享 内 存 的 各 个 处 理 器 对 于 共享 操作 要 变 得 更 加 
精明 些 。 为 此 ， 一 种 常见 的 做 法 是 ， 各 个 处 理 器 均 通 过 窥探 ( snooping) 内 存 总 线 来 监视 针 
对 共享 内 存 的 相关 操作 。 对 于 处 理 器 硬件 来 说 ， 这 是 额外 的 工作 ， 但 却 是 非常 值得 付出 的 努 
力 一 一 采用 多 个 处 理 器 带 来 的 提速 潜力 是 相当 巨大 的 。 另 外 ， 高 速 缓存 硬件 也 必须 要 更 加 精 
明 些 ， 因 为 每 个 处 理 器 都 可 能 在 其 高 速 缓存 中 拥有 对 应 信号 量 的 一 个 副本 ， 并 且 如 果 一 个 处 
理 器 改变 了 该 信号 量 的 取 值 ， 那 么 所 有 其 他 的 副本 也 必须 同时 被 更 新 。 对 于 处 理 器 架构 设计 
人 员 来 说 ， 这 些 都 是 非常 重要 的 问题 ， 并 且 受 到 了 非常 广泛 的 争论 。 


9.3.9 优先 级 倒置 


当 较 低 优先 级 任务 持 有 较 高 优先 级 运行 的 任务 所 需 的 共享 资源 时 ， 就 可 能 出 现 一 种 所 谓 
优先 级 倒置 ( priority inversion) 的 情况 。 这 种 倒置 将 导致 高 优先 级 任务 的 阻塞 ， 直 到 相应 资 
源 被 释放 为 止 。 其 实质 是 颠倒 了 这 两 个 任务 的 优先 级 。 如 果 其 他 某 个 没有 使 用 对 应 共享 资源 
的 中 等 优先 级 的 任务 试图 运行 ， 则 该 中 等 优先 级 的 任务 将 先 于 低 优先 级 任务 和 高 优先 级 任务 
而 执行 。 一 般 而 言 ， 优 先 级 倒置 往往 不 会 引起 巨大 的 危害 。 其 后 果 只 不 过 是 ， 高 优先 级 任务 
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的 延迟 未 被 察觉 ， 而 最 后 低 优先 级 任务 还 是 会 释放 相应 共享 资源 的 。 但 是 ， 优 先 级 倒置 也 可 
能 会 引起 一 些 严 重 的 问题 。 进 一 步 说 ， 如 果 高 优先 级 任务 被 延迟 足够 长 的 时 间 ， 那 么 可 能 导 
致 定时 器 的 触发 和 操作 系统 的 重启 。 火 星 探 路 者 (Mars Pathfinder) 项 目 就 曾 发 生 过 这 样 的 
优先 级 倒置 问题 ， 并 导致 相应 系统 好 多 次 执行 重启 操作 。 至 少 来 说 ， 优 先 级 倒置 可 能 使 系统 
看 起 来 会 不 合 常理 地 慢 下 来 。 另 外 ， 低 优先 级 任务 之 所 以 拥有 较 低 的 优先 级 ， 常 常 是 因为 ， 
只 要 它们 的 工作 最 终 可 以 完成 ， 它 们 在 哪个 特定 时 间 段 〈 或 称 为 时 间 帧 ) 完成 并 不 重要 。 然 
而 ， 高 优先 级 任务 则 经 常 有 严格 的 时 间 限 制 ， 这 类 任务 往往 和 用 户 界面 一 aa 
实时 任务 上 运作 。 因 而 ， 优 先 级 倒置 可 能 会 降低 系统 的 响应 速度 。 


9.3.10 ”经 典 问题 


有 一 个 问题 在 操作 系统 中 经 常会 出 现 ， 称 为 生产 者 - 消费 者 问题 (producer-consumer 
problem) 或 有 界 缓冲 区 问题 ( bounded-buffer problem)。 这 是 多 进程 同步 问题 的 一 个 例子 。 
该 问题 涉及 至 少 两 个 进程 ， 其 中 一 个 是 数据 的 生产 者 ， 而 另 一 个 是 数据 的 消费 者 ， 并 且 它 们 
之 间 共 享 着 一 个 公共 的 大 小 固定 的 缓冲 区 。 生 产 者 进程 的 任务 是 连续 不 断 地 生成 数据 块 并 将 
它们 放 进 缓冲 区 中 。 与 此 同时 ,消费 者 进程 则 通过 每 次 从 缓冲 区 提取 一 块 数据 的 方式 来 消费 
数据 。 需 要 指出 的 是 ， 如 果 缓 冲 区 中 已 经 放 满 了 数据 ， 那 么 生产 者 就 不 应 该 再 向 缓冲 区 中 添 


加 数据 。 相 应 地 ， 消 费 者 也 不 应 该 试图 从 空 的 缓冲 区 中 去 拿 走 数 据 。 这 一 问题 的 一 种 解决 方 


案 参见 下 面 给 出 的 程序 伪 代 码 。 该 解决 方案 适用 于 多 个 消费 者 和 多 个 生产 者 ， 不 过 在 这 里 ， 
我 们 将 就 一 个 生产 者 和 一 个 消费 者 的 情形 具体 展开 讨论 。 


semaphore mutex = 1 
semaphore full = 0 
semaphore empty = BUFFER SIZE 


procedure producer() { 
while (true) { 
item = produceItem() 
wait (empty) 
wait(mutex) 
putIitemIntoBuffer(item) 
signal (mutex) 
signal (full) 
} 
} 


procedure consumer() { 

while (true) { 

wait(full) 

wait(mutex) 

item = removeItemFromBuffer!() 
signal (mutex) 

signal(empty) 
consumeItem(item) 

} 

} 


生产 者 的 解决 方案 是 ， 如 果 缓 冲 区 已 经 填 满 ， 就 阻塞 自己 。 每 次 消费 者 从 缓冲 区 中 拿 走 
一 块 数据 时 ， 它 都 会 发 信号 通知 生产 者 可 以 再 次 往 缓冲 区 中 填 放 数据 了 。 同 样 ， 消 费 者 如 果 
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发 现 缓冲 区 是 空 的 ， 也 会 阻塞 自己 。 每 次 生产 者 将 数据 放 人 缓冲 区 中 时 ， 它 都 会 发 信号 通知 
消费 者 可 以 继续 从 缓冲 区 中 提取 数据 了 。 计 数 型 信号 量 fall 表示 当前 缓冲 区 中 放 有 数据 的 数 
量 ， 计 数 型 信号 量 empty 则 表示 缓冲 区 中 还 可 填 放 数据 的 数量 ， 而 二 值 型 信号 量 mutex 则 用 
于 建立 互 斥 访问 机 制 。 


9.3.11 管 程 


虽然 表面 上 看 起 来 似乎 并 不 困难 ,但 是 ， 锁 和 信号 量 的 使 用 则 是 程序 设计 中 非常 容易 出 
错 的 部 分 。 为 了 使 关于 上 锁 和 开锁 的 相关 处 理 更 为 健壮 ， 一 些 高 级 语言 中 已 经 引入 了 用 于 表 
达 同 步 需求 的 相应 机 制 。 这 种 机 制 被 称 为 管 程 (monitor)。 管 程 并 不 是 操作 系统 的 结构 体 ， 
而 是 以 一 种 相对 不 容易 出 错 的 方式 对 操作 系统 结构 体 进行 打包 处 理 的 方法 。 进 一 步 说 ,一 个 
管 程 就 是 嵌 人 了 互 斥 和 线程 同步 功能 的 某 样 东西 。 这 些 功 能 由 编程 语言 进行 定义 ， 以 便 编 译 
器 可 以 生成 正确 的 代码 来 实现 相应 管 程 。 虽 然 管 程 在 不 同 的 语言 中 采取 了 不 同 的 形式 ， 但 是 
关于 管 程 ， 还 是 有 一 些 我 们 可 以 介绍 的 通用 的 内 容 。 

一 个 管 程 往往 与 对 应 语言 中 的 某 种 东西 (例如 过 程 或 类 ) 相关 联 。 而 互 斥 机 制 则 常常 与 
进程 相关 联 。 无 论 在 任何 时 候 ， 只 能 有 相关 联 进程 的 一 个 线程 可 以 在 管 程 中 执行 。 一 个 管 程 
进程 在 执行 其 他 任何 操作 之 前 ， 通 常会 尝试 访问 对 应 锁 ， 进 而 持 有 它 ， 直 到 完成 结束 或 需要 
等 待 某 项 条 件 。 当 一 个 进程 结束 时 ， 它 将 释放 对 应 锁 ， 从 而 不 会 发 生死 锁 。 

管 程 也 可 以 拥有 条 件 变 量 (condition variables)。 为 此 ， 在 相关 条 件 不 适合 某 线程 ( 译 者 
注 : 不 妨 设 为 线程 A) 继续 使 用 管 程 执行 时 ， 便 可 人 允许 该 线程 A 进行 等 待 。 在 这 种 情况 下 ， 
对 应 线程 A 将 被 阻塞 ， 而 另 一 个 线程 ( 译 者 注 : 不 妨 设 为 线程 B) 将 被 赋予 锁 和 人 允许 执行 。 
这 里 的 另 一 个 线程 B 可 能 会 改变 该 管 程 的 状态 。 如 果 现 在 相关 条 件 满足 正在 等 待 的 线程 A 
继续 执行 的 要 求 ， 那 么 正在 运行 的 线程 B 可 以 向 等 待 的 线程 A 发 出 通知 信号 。 这 样 将 会 把 
等 待 的 线程 A 移 回 到 就 绪 队列 ， 以 便 其 可 以 在 管 程 变 为 空闲 的 时 候 恢复 执行 。 以 下 代码 使 
用 了 条 件 变 量 ， 用 于 实现 每 次 只 能 存储 一 条 消息 的 通信 信道 : 

monitor channel { 

condition can send 

condition can receive 


char contents 
boolean full := false 


function send (char message) { 
while full then wait (can receive) 
contents := message 

full := true 

signal (can send) 


function receive () { 

var char received 

while not full then wait (can send) 
received := contents 

full := false 

signal (can receive) 

return received 
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9.4 死 锁 


9.4.1 什么 是 死 锁 


一 个 非常 简单 的 例子 

假设 我 们 有 两 个 进程 A 和 B， 它 们 要 共享 两 个 不 同 的 资源 1 和 2。 进 程 A 首先 锁定 资 
源 1， 然 后 再 锁定 资源 2， 接 下 来 利用 资源 完成 相关 工作 ， 继 而 再 释放 有 关 资 源 。 进 程 B 则 [97] 
首先 锁定 资源 2， 然 后 再 锁定 资源 1， 接 下 来 利用 资源 完成 相关 工作 ， 继 而 再 释放 有 关 资 源 。 
这 些 事件 发 生 的 粗略 过 程 如 图 9-3 所 示 。 





图 9-3 ”共享 两 个 资源 的 两 个 进程 


现在 考虑 一 下 ， 如 果 进 程 A 在 时 间 节 点 逆 处 发 生 中 断 (有 可 能 是 进程 A 已 经 耗 尽 了 它 
分 配 获得 的 时 间 片 ， 故 而 操作 系统 将 其 从 运行 状态 中 取出 并 放 回 到 就 绪 队 列 里 )， 将 会 发 生 
什么 ”这 时 候 ， 进 程 A 已 经 锁定 了 资源 1。 不妨 设 想 ， 现 在 进程 B 启动 执行 了 ， 它 先 锁定 
了 资源 2， 然后 便 去 尝试 锁定 资源 1。 但是， 由 于 进程 A 已 经 锁定 了 资源 1 并 保持 占有 ， 所 
以 操作 系统 就 把 进程 B 置 为 等 待 状态 ， 之 后 还 启动 执行 了 其 他 某 个 进程 。 总 有 某 个 时 刻 ， 
进程 A 会 到 达 就 绪 队 列 的 队 首 ， 并 被 调度 器 再 次 启动 运行 。 它 运行 很 短暂 的 时 间 便 会 尝 i 
去 锁定 资源 2。 然 而 ， 由 于 进程 B 已 经 锁定 了 资源 2 并 保持 占有 ， 所 以 进程 A 也 将 被 置 为 
等 待 状态 。 于 是 ， 这 两 个 进程 现在 就 陷入 了 死 锁 状态 。 换 句 话说 ， 这 两 个 进程 没有 任何 一 个 
进程 会 完成 ， 因 为 每 个 进程 都 持 有 另 一 个 进程 正在 等 待 的 资源 。 

从 这 个 简单 的 例子 ,很 容易 可 以 看 出 死 锁 发 生 的 两 个 必要 条 件 。 第 一 个 条 件 是 ， 必 须 
涉及 了 不 可 共享 的 资源 ， 称 之 为 互 斥 条 件 (mutual exclusion)。 就 锁 而 言 ， 这 是 非常 清楚 的 ， 
从 其 定义 就 可 一 目 了 然 地 看 出 一 一 任何 时 间 只 有 一 个 进程 可 以 持 有 一 个 锁 。 但 就 某 些 资源 来 
讲 ， 这 就 不 那么 清晰 了 ， 后面 将 会 就 此 进行 讨论 。 死 锁 的 第 二 个 必要 条 件 是 ， 在 进程 等 待 
一 个 资源 的 同时 ， 其 必须 占有 和 保持 另 一 个 资源 ， 称 之 为 持 
有 一 等 待 (hold-and-wait) 条 件 。 再 次 地 ， 就 锁 而 言 ， 我 们 
可 以 看 到 ， 一 个 进程 通常 情况 下 可 以 获得 很 多 它 所 需要 的 锁 
而 不 用 释放 它 当 前 持 有 的 任何 锁 。 

一 些 较为 复杂 的 例子 

“哲学 家 就 餐 ” 问 题 是 计算 机 科学 文献 中 特别 喜欢 的 一 
个 例子 。 在 这 个 问题 里 (如 图 9-4 所 示 )， 有 三 位 哲学 家 围 坐 
在 一 张 桌子 旁边 ， 或 者 吃饭 ， 或 者 思考 。 一 般 来 说 ， 经 过 一 
段 时 间 的 思考 之 后 ， 哲 学 家 就 想 要 吃饭 。 正 在 供应 的 膳食 是 
米饭 ， 且 要 求 用 两 根 和 包子 来 进餐 ， 而 在 桌子 上 每 个 对 应 两 个 ”图 9-4 “哲学 家 就 餐 ”问题 
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哲学 家 之 间 的 位 置 都 放 有 一 根 秘 子 ( 译 者 注 : 故而 总 共有 三 根 和 包子 )。 当 要 吃饭 的 时 候 ， 各 
位 哲学 家 都 是 ， 先 拿 起 一 根 左边 的 簧 子 ， 再 拿 起 一 根 右 边 的 筑 子 ， 然 后 开始 吃饭 。 很 明显 ， 
这 种 安排 很 容易 会 导致 死 锁 。 具 体 而 言 ， 设 想 某 个 时 刻 ， 三 位 哲学 家 先后 决定 了 要 吃饭 ， 于 
是 ， 每 位 哲学 家 都 先 把 手 伸 向 了 自己 的 左边 ， 并 各 自 拿 起 了 一 根 簧 子 。 然 后 ， 所 有 哲学 家 都 
被 中 断 和 停 了 下 来 ， 不 得 不 要 等 上 一 会 儿 (就 像 上 面 简单 的 例子 所 描述 的 那样 ) 。 

当 某 位 哲学 家 恢复 处 理 ( 即 继续 试图 取 千 吃饭 的 时 候 )， 其 尝试 去 拿 起 自己 右边 的 镜子 ， 
但 发 现 相 应 的 镜子 已 经 被 占用 了 ， 所 以 只 好 停 下 来 等 待 右边 的 筷子 。 我 们 让 在 桌子 周围 的 这 
三 位 哲学 家 都 尝试 上 一 遍 ， 最 终 他 们 也 陷 人 了 死 锁 状态 一 一 每 位 哲学 家 都 持 有 一 根 簧 子 同时 
在 等 待 另 一 根 簧 子 。 这 个 例子 和 第 一 个 例子 的 区 别 在 于 ， 本 例 中 的 进程 (哲学 家 ) 数 要 多 于 
两 个 ， 而 资源 (筷子 ) 数 也 多 于 两 个 。 每 个 进程 持 有 一 个 资源 ， 并 在 等 待 另 一 个 资源 。 这 种 
情况 称 为 循环 等 待 〈 circular wait) 条 件 。 在 第 一 个 例子 中 也 出 现 了 这 样 的 情况 ， 不 过 由 于 只 
有 两 个 进程 ， 所 以 很 难看 出 这 种 圆圈 即 循环 。 换 句 话 说， 每 个 进程 都 拥有 一 个 资源 是 另 一 个 
进程 所 需要 的 。 正 如 在 哲学 家 就 餐 问 题 中 所 看 到 的 那样 ， 这 种 条 件 所 要 求 的 是 ， 存 在 某 种 进 
程序 列 ， 每 个 进程 持 有 其 序列 中 对 应 下 一 个 进程 所 需要 的 资源 ， 以 此 类 推 ， 故 而 序列 末尾 的 
进程 持 有 第 一 个 进程 所 需要 的 资源 。 有 一 种 简单 的 方法 可 以 避免 这 类 情形 ， 我 们 将 在 本 章 后 
面 的 部 分 展开 讨论 。 

在 现实 世界 中 经 常 引 用 的 死 锁 的 例子 是 城市 街道 上 的 格 锁 式 交通 堵塞 。 例如， 图 9-5 就 
给 出 了 一 个 简单 的 格 锁 式 交通 堵塞 。( 为 简便 起 见 ， 我 们 演示 的 是 单 向 街道 。) 在 这 个 例子 
里 ， 你 会 看 到 许多 不 同 的 进程 (汽车 )， 每 个 进程 都 想 使 用 其 前 面 的 那个 进程 已 经 在 使 用 的 
资源 。 本 例 中 ， 相 应 资源 是 指 对 应 街道 上 的 位 置 。 很 清楚 ， 其 间 存 在 互 斥 一 一 没有 两 辆 车 可 
以 同时 位 于 相同 的 位 置 上 。 同 时 还 有 循环 等 待 一 一 从 图 上 看 这 是 显而易见 的 。 但是， 请 注意 
标记 为 A 的 那 辆 车 。 虽 然 这 辆 车 也 在 等 待 ， 但 它 并 不 是 死 锁 的 组 成 部 分 ， 因 为 没有 其 他 车 
正在 等 待 它 所 持 有 的 资源 。 

在 关于 死 锁 的 许多 分 析 中 ,还 陈述 了 第 四 个 条 件 一 一 不 允许 抢占 。 抢 占 ( preemption) 
意味 着 我 们 可 以 从 某 个 进程 那里 拿 走 其 当前 持 有 的 某 个 资源 ， 故 而 会 打破 僵局 、 解 除 死 锁 。 
但 是 在 我 们 的 分 析 中 ， 抢 占 却 是 死 锁 的 一 种 解决 方案 。 加 上 一 项 不 允许 抢占 的 “条 件 ” 仅 仅 
是 关于 “ 死 锁 问 题 的 一 种 可 能 的 解决 方案 未 被 使 用 ”的 一 种 说 法 而 已 。 实 际 上 ， 这 并 不 是 死 
锁 的 必要 条 件 。 我 们 将 在 本 章 的 后 续 部 分 就 此 展开 进一步 的 讨论 。 

资源 分 配 图 

经 常用 来 解释 死 锁 的 一 种 工具 称 为 资源 分 配 图 (resource-allocation graph)。 资 源 分 配 图 
一 般 会 标明 进程 、 资 源 以 及 哪个 进程 正在 等 待 或 者 持 有 哪 种 资源 实例 。 有 关 示 例如 图 9-6 所 
示 。 图 中 的 每 个 结 点 ， 或 者 表示 一 个 进程 (这 里 标记 为 一 个 三 角形 )， 或 者 表示 一 个 资源 (这 
里 标记 为 一 个 圆 角 方 框 )。 由 进程 B 指向 资源 2 的 有 向 边 表 示 进 程 B 正在 等 待 资源 2， 而 由 
资源 1 指向 进程 A 的 有 向 边 则 表示 进程 A 持 有 资源 1。 如 果 存 在 死 锁 ， 那 么 图 中 将 会 存在 
环 路 即 循环 ， 并 且 从 图 中 可 以 很 明显 地 看 出 来 。 在 计算 机 系统 中 ， 一 个 资源 往往 存在 不 止 一 
个 而 是 两 个 以 上 的 实例 。 在 这 种 情况 下 ， 传 统 做 法 是 在 图 中 把 资源 的 每 个 实例 标记 为 相应 
资源 结 点 内 的 单个 的 点 。 这 样 ， 此 类 图 中 的 一 个 环 路 或 循环 就 不 一 定 意味 着 存在 死 锁 ， 因 为 
此 时 仍然 有 可 能 存在 每 个 资源 的 空闲 可 用 的 实例 。 遗 憾 的 是 ， 操 作 系 统 无 法 识别 图 ， 所 以 这 
种 技术 对 操作 系统 来 讲 ， 不 像 对 人 类 分 析 人 员 那 么 有 用 。 诚 然 ， 程序 设 计 人 员 可 以 模拟 一 幅 
图 ， 并 编写 一 个 程序 来 完成 心目 中 的 对 一 幅 图 的 搜索 ， 但 那 不 是 一 回 事 。 
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9.4.2 ”可 以 对 死 锁 采取 哪些 措施 


总 的 来 说 ， 有 4 种 方法 可 以 用 来 应 对 死 锁 问 题 。 第 一 种 ,我 们 可 以 通过 确保 死 锁 发 生 
的 某 项 必要 条 件 不 成 立 来 预防 死 锁 的 发 生 。 第 二 种 ， 我 们 可 以 允许 所 有 这 三 项 必要 条 件 都 发 
生 ， 但 是 通过 确保 我 们 不 会 以 死 锁 可 能 发 生 的 方式 来 分 配 资源 从 而 避免 死 锁 。 第 三 种 ， 我 们 
甚至 可 以 允许 死 锁 发 生 ， 检 测 死 锁 的 发 生 ， 然 后 还 可 能 针对 发 生 的 死 锁 采 取 某 种 措施 。 最 后 
一 种 ,我 们 可 以 直接 忽略 死 锁 和 不 予 理 皮 。 


9.4.3” 死 锁 预 防 


预防 死 锁 应 当 保 证 死 锁 的 三 项 必要 条 件 中 的 一 项 或 多 项 不 会 发 生 。 接 下 来 ， 我 们 针对 这 
三 项 条 件 依次 阐明 相应 的 死 锁 预防 方案 。 

互 斥 条 件 

在 计算 机 系统 中 ， 有 些 资源 非常 明显 是 不 可 共享 的 。 举 例 来 说 ， 如 果 一 个 进程 正在 一 台 
打印 机 上 打印 工资 单 ， 那 么 对 于 要 在 同一 台 打印 机 上 开始 打印 电子 邮件 消息 的 另 一 个 进程 来 
说 ， 将 是 行 不 通 的 ， 即 不 能 执行 的 。( 当 然 ， 我 们 可 以 通过 假 脱 机 输出 技术 来 模拟 对 打印 机 
的 同时 访问 。 我 们 将 就 此 在 本 节 的 后 续 部 分 展开 进一步 的 讨论 。) 类 似 地 ， 如 果 一 个 进程 正 
在 向 一 台 磁 带 驱 动 器 写 人 人 记录， 那么 对 于 要 开始 使 用 同一 台 磁 带 驱动 器 的 另 一 个 进程 来 说 ， 
也 是 不 可 行 的 。 有 些 其 他 的 资源 则 明显 是 可 以 共享 的 。 例 如 ， 网 络 接 口 卡 (network interface 
card， 简 称 网 卡 ; 或 称 为 网 络 适 配器 ， 即 network adapter) 则 极 有 可 能 允许 被 多 个 应 用 程序 
同时 共享 。 进 一 步 说 ， 一 台 服 务 器 可 能 通过 同一 个 网 络 适 配器 运行 若干 不 同 的 服务 一 一 可 能 
包括 万 维 网 服务 器 (Web server)、 文 件 服务 器 (file server) 和 文件 传输 服务 器 (FTP server)。 
请 求 操 作 可 能 是 从 网 络 中 的 其 他 主机 随机 到 达 的 ， 而 响应 则 可 能 是 由 对 应 的 服务 器 进程 按照 
排队 方式 进行 处 理 的 。 有 人 可 能 会 认为 有 关 消 息 不 是 一 起 出 去 的 一 一 也 就 是 说 ， 相 应 线路 并 
不 是 真正 地 被 “同时 ”使 用 的 。 然 而 ， 关 键 在 于 从 来 没有 进程 会 不 得 不 停 下 来 等 待 网 络 发 送 
数据 。 假 设 有 足够 的 内 存 空间 可 以 用 作 缓 冲 区 ， 那 么 将 没有 进程 会 因为 其 正在 等 待 向 网 络 发 
送 数 据 而 陷入 死 锁 。( 诚 然 ， 有 关 进 程 可 能 必须 得 等 待 响应 ， 然 而 这 不 是 一 码 事 。) 同样 ， 访 
问 一 台 磁 盘 驱 动 器 上 的 文件 在 软件 级 别 上 也 是 可 以 共享 的 。 两 个 进程 可 以 在 同一 台 硬 盘 驱 动 
器 上 打开 有 关 文 件 ， 并 且 可 以 在 单个 的 驱动 器 上 对 这 些 文件 进行 读 取 和 写 人 ， 而 无 须 等 待 其 
他 的 进程 完全 完成 其 相应 的 文件 处 理 。 

但 有 些 资源 则 不 是 那么 明显 ， 例 如 随机 访问 存储 器 ， 即 内 存 。 有 人 可 能 会 认为 内 存 是 可 
以 共享 的 ， 因 为 许多 进程 可 以 同时 使 用 内 存 的 各 个 部 分 。 然 而 ， 有 关 进 程 通常 被 赋予 对 内 存 
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块 的 排他 性 访问 权限 ， 并 且 不 允许 其 去 访问 被 分 配给 其 他 进程 的 内 存 块 。 因 此 ， 从 这 个 意义 
上 来 讲 ， 内 存 并 不 是 真正 可 以 共享 的 。 尽 管 如 此 ， 关 于 进程 确实 共享 内 存 的 例子 很 多 ， 所 以 
从 这 点 上 来 说 ， 很 难 对 内 存 进 行 归 类 。 对 于 大 多 数 的 操作 系统 而 言 ， 单 个 文件 的 访问 可 以 是 
共享 的 。 举 例 来 说 ， 如 果 我 们 在 一 个 分 时 系统 上 拥有 一 部 拼 法 字典 ， 那 么 每 个 用 户 就 可 以 同 
时 针对 不 同 的 文档 进行 拼写 检查 。 但 是 ， 如 果 相 应 系统 是 一 个 库存 系统 并 且 我 们 拥有 若干 进 
程 试 图 同时 向 不 同 客户 划拨 库存 ， 那 么 有 关 应 用 程序 便 需 要 锁定 相关 文件 (或 至 少 一 部 分 文 
件 )， 以 便 不 会 发 生 我 们 尝试 把 最 后 一 个 小 部 件 发 送 给 三 个 不 同 客户 的 状况 。 因 此 ,文件 并 
不 是 本 质 上 可 共享 或 不 可 共享 的 ， 具 体 应 取决 于 对 它们 的 使 用 。 

即使 是 对 于 如 打印 机 之 类 的 不 可 共享 的 设备 ， 我 们 也 可 以 利用 某 些 机 制 把 针对 一 台 打 印 
机 的 绝 大 部 分 多 数 情况 的 使 用 转变 成 为 一 种 可 共享 的 事件 。 其 对 应 的 解决 方案 就 是 使 用 假 脱 
机 技术 。 操 作 系 统 不 是 直接 将 数据 写 人 打印 机 ， 而 是 将 从 应 用 程序 获取 到 的 数据 临时 存放 在 

一 个 磁盘 文件 中 。 随 后 ， 当 它 知道 对 应 打印 机 可 以 使 用 且 安 装 了 合适 的 打印 纸 等 前 提 的 情况 
下 ,， 才 会 真正 把 数据 打印 到 打印 机 上 。 因 为 我 们 已 经 清除 了 涉及 打印 机 的 互 斥 条 件 ， 所 以 我 
们 就 把 打印 机 移 除 出 可 能 引发 死 锁 的 资源 列表 。 另 一 方面 ， 即 便 是 使 用 假 脱 机 技术 也 可 能 会 
发 生 某 种 类 型 的 死 锁 。 进 一 步 说 ， 当 操作 系统 为 多 个 应 用 程序 假 脱 机 打印 机 输出 时 ， 它 会 暂 
时 把 相关 输出 写 到 磁盘 上 ， 而 分 配给 假 脱 机 模块 的 磁盘 空间 被 填 满 是 完全 有 可 能 的 。 因 此 ， 
这 便 可 能 再 次 让 系统 暴露 在 可 能 的 死 锁 状 态 。 

然而 ， 至 关 重 要 的 问题 是 ， 由 于 某 些 资源 本 质 上 是 不 可 共享 的 ， 所 以 消除 互 斥 条 件 并 不 
是 一 种 普遍 适用 的 解决 方案 。 

持 有 - 等 待 条 件 

我 们 可 以 采用 两 种 途径 来 避免 死 锁 发 生 所 必需 的 持 有 - 等 待 条 件 。 首 先 ， 我 们 可 以 要 
求 一 个 进程 必须 在 其 启动 时 就 请 求 它 在 整个 执行 过 程 中 所 需要 的 所 有 的 资源 。 对 于 一 些 简 单 
的 批 处 理 系 统 来 说 ， 这 有 可 能 是 可 以 接受 的 , 但 是 对 于 大 多 数 现 代 的 应 用 系统 来 说 ， 则 是 不 
可 行 的 。 仅 仅 从 关于 可 能 事件 的 太 多 的 组 合 这 一 点 上 来 说 ， 对 所 有 需求 的 预测 就 是 无 法 实现 
的 。 此 外 ，80/20 法 则 一 一 也 就 是 说 ， 在 80% 的 情况 下 ， 我 们 仅仅 需要 很 少量 的 资源 ; 而 只 
有 在 20% 的 情况 下 ， 我 们 才 需 要 较 大 份额 的 其 他 内 存 一 一 适用 于 大 多 数 的 情况 。 如 果 我 们 
要 按照 最 坏 的 情形 来 提前 申请 资源 ， 那 么 大 多 数 时 候 我 们 将 会 把 我 们 并 不 需要 的 资源 无 效 地 
占有 起 来 而 使 得 这 些 资源 不 能 被 用 到 其 他 真正 需要 和 发 挥 作用 的 地 方 。 

第 二 种 方案 是 ， 要 求 申请 资源 的 任何 进程 在 申请 任何 其 他 资源 之 前 必须 首先 将 其 持 有 
的 所 有 资源 释放 掉 。 于 是 ， 在 我 们 的 第 一 个 例子 中 ， 当 进程 B 想 要 申请 资源 1 时 ， 它 必 
须 首 先 释放 资源 2， 然 后 再 同时 申请 资源 1 和 资源 2。 但 因为 进程 A 占有 资源 1， 所 以 进 
程 B 不 能 分 配 获得 这 两 个 资源 ， 只 好 等 待 ， 而 且 它 现在 不 再 持 有 资源 2。 某 个 时 候 ， 进 程 
A 终 将 获得 其 下 一 个 时 间 片 ， 进 而 首先 释放 资源 1 并 尝试 同时 申请 资源 1 和 资源 2。 由 于 
进程 A 当前 占有 处 理 器 ， 所 以 它 将 被 允许 锁定 这 两 个 资源 ， 并 将 继续 执行 。 当 它 利用 这 
两 个 资源 完成 相关 任务 并 释放 掉 它们 之 后 ， 某 个 时 候 进 程 B 也 将 最 终 被 置 于 就 绪 状 态 ， 
并 且 将 被 授权 访问 这 两 个 资源 和 继续 执行 。 这 样 ， 我 们 便 防止 了 死 锁 。 然 而 ， 如 果 一 个 
应 用 程序 使 用 的 是 不 可 共享 的 资源 ， 有 关 应 用 程序 如 何 释 放 相 应 资源 呢 ? 还 有 ， 这 种 不 
断 地 释放 和 重新 锁定 除了 在 最 简单 的 情况 下 可 以 使 用 之 外 ， 其 效率 也 未 免 有 些 太 过 低下 
了 。 因 此 ， 就 像 互 斥 条 件 一 样 ， 消 除 持 有 - 等 待 条 件 通 常 并 不 是 解决 死 锁 问题 的 一 种 有 效 
方案 。 
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循环 等 待 条 件 

死 锁 的 最 后 一 个 必要 条 件 是 循环 等 待 ， 而 且 有 一 种 非常 简单 的 通过 不 允许 这 种 情况 发 生 
来 预防 死 锁 的 方法 。 具 体 而 言 ， 相 应 的 解决 方案 要 求 首先 针对 系统 中 的 所 有 资源 确立 一 种 排 
序 。( 除 了 当 有 关 排 序 与 相关 程序 最 有 可 能 锁定 资源 的 顺序 相 匹 配 的 情况 下 可 以 取得 最 好 的 
运行 效果 之 外 ， 这 种 排序 并 没有 任何 实际 意义 。) 在 此 基础 上 ， 要 求 所 有 的 进程 都 必须 以 相 [02 
同 的 次 序 来 锁定 资源 。 这 样 便 可 以 防止 循环 等 待 条 件 的 形成 。 再 次 考虑 第 一 个 例子 。 如 果 进 
程 A 和 进程 B 均 在 尝试 锁定 资源 2 之 前 都 先 尝试 锁定 资源 1， 那么 就 永远 不 会 出 现 这 两 个 
进程 之 间 的 死 锁 。 因 为 当 第 二 个 进程 尝试 锁定 资源 1 时 ， 它 将 被 强制 等 待 。 如 果 牵 涉 多 个 进 
程 和 多 个 资源 ， 这 种 解决 方案 也 很 有 效 。 

遗憾 的 是 ， 作 为 操作 系统 中 用 于 死 锁 预 防 的 一 种 通用 的 解决 方案 ， 资 源 排序 并 不 是 一 种 
真正 可 行 的 解决 方案 。 一 方面 ， 操 作 系统 实用 程序 、 第 三 方 软件 和 终端 用 户 应 用 程序 等 各 方 
都 不 得 不 按照 在 内 心 的 某 种 这 样 的 标准 来 编写 ， 另 一 方面 并 不 存在 这 样 的 标准 。 尽 管 如 此 ， 
对 于 在 具有 多 个 并 发 运行 子 系统 的 大 型 系统 上 工作 的 开发 团队 来 说 ， 资 源 锁定 排序 则 是 避免 
在 相关 应 用 系统 自身 内 部 产生 死 锁 的 一 种 有 效 技术 。 因 此 ， 即 便 这 并 不 是 死 锁 问题 的 一 般 的 
解决 方案 ， 但 它 却 是 一 项 需要 掌握 的 重要 技术 。 


9.4.4 死 锁 避 免 


到 目前 为 止 ， 我 们 关于 资源 的 示例 中 ， 往 往 只 说 明了 每 种 资源 的 一 个 实例 。 一 个 简单 的 
锁 每 次 只 能 有 一 个 用 户 ， 一 台 打印 机 每 次 也 只 能 有 一 个 用 户 ， 以 此 类 推 。 但 对 于 其 他 的 资源 
来 说 ,一般 可 以 有 相应 资源 的 许多 实例 。 最 为 明显 的 例子 是 随机 访问 存储 器 ( 即 内 存 ) 一 一 
也 就 是 说 ， 总 会 有 许多 内 存 块 要 分 配 。 类 似 地 ， 我 们 可 能 拥有 多 台 可 以 用 来 安装 磁带 的 磁带 
驱动 器 。 在 一 台大 型 机 上 ， 我 们 甚至 可 能 拥有 多 台 相 同 的 打印 机 ， 而 不 用 真正 关心 我 们 到 底 
要 使 用 哪 一 台 。 在 研究 死 锁 避免 机 制 时 ， 我 们 常常 要 考虑 相关 资源 拥有 多 个 实例 这 样 的 更 为 
一 般 化 的 情况 。 

对 于 死 锁 避免 而 言 ， 通 常 有 两 种 机 制 ， 而 且 这 两 种 机 制 均 要求 : 在 一 个 进程 运行 之 前 ， 
它 必 须 向 操作 系统 提供 其 将 会 申请 的 每 类 资源 实例 的 最 大 数量 (涵盖 所 有 各 种 情况 )。 举 例 
来 说 ， 它 可 能 会 声称 ， 自 己 将 仅仅 需要 543KB 的 内 存 、 一 台 打 印 机 和 三 台 磁 带 机 。 然 后 ， 
操作 系统 可 以 采用 两 种 方式 来 使 用 这 些 数据 。 第 一 种 方式 是 使 用 有 关 数 据 来 决定 是 否 要 运行 
相应 作业 。 进 一 步 说 ， 当 操作 系统 要 启动 一 道 作 业 时 ， 操 作 系统 可 以 查看 系统 当前 可 用 的 各 
类 资源 数量 ， 并 确认 这 些 资 源 是 否 可 以 满足 应 用 程序 可 能 申请 的 最 大 需求 数量 。 不 妨 假设 ， 
系统 现在 可 能 拥有 打印 机 和 三 台 磁 带 驱动 器 可 以 分 配给 对 应 程序 ， 但 却 只 有 506KB 的 内 存 。 
如 果 操 作 系 统 无 法 确保 能 否 授予 对 应 作业 可 能 请 求 的 所 有 各 类 资源 的 最 大 数量 ， 那 么 它 将 不 
会 运行 对 应 作业 。 这 样 ， 操 作 系统 就 会 避免 将 自己 置 于 可 能 发 生死 锁 的 境地 。 这 当然 是 非常 
安全 的 ， 但 却 不 是 一 种 充分 最 优化 的 解决 方案 ， 因 为 有 关 作业 可 能 常常 在 不 需要 获得 其 最 坏 
情况 下 所 需 各 类 资源 的 条 件 下 运行 。 这 其 实 等 效 于 要 求 进程 提前 申请 所 需 的 所 有 资源 。 

第 二 种 解决 方案 要 更 困难 些 ， 但 更 接近 于 最 优化 。 对 于 这 种 方案 而 言 ， 操 作 系统 将 不 
用 检查 作业 所 需 的 最 大 资源 数量 就 可 以 启动 作业 的 运行 ， 但 是 当 程序 请 求 任何 资源 时 ， 操 作 
系统 将 需要 确定 自己 能 否 满足 该 项 申请 以 及 分 配 后 是 否 仍然 能 够 完成 所 有 已 经 在 运行 的 各 道 
作业 。 如 果 系 统 不 能 安全 地 满足 相应 进程 所 提出 的 资源 申请 ， 那 么 它 将 把 该 进程 置 为 等 竺 
状态 。 即 使 所 有 当前 正在 运行 的 作业 都 按照 它们 所 声称 的 可 能 使 用 的 所 有 资源 最 大 数量 来 ”203| 
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进行 申请 ， 操 作 系统 也 可 以 断定 自己 可 以 顺利 完成 所 有 这 些 作 业 运 行 的 状态 被 称 为 安全 状态 
(safe state) 。 

在 图 9-7 所 给 出 的 示例 中 ， 操 作 系 统 正在 监控 A、B、C、D 四 类 资源 。 对 于 这 些 资源 
来 讲 ， 系 统 当 前 分 别 拥 有 1、5、2、0 个 未 分 配 的 (可 用 的 ) 实例 。 需 要 说 明 的 是 ， 为 了 简 
便 起 见 ， 我 们 在 图 中 显示 这 些 资 源 的 计数 列表 时 ,没有 带 豆 号。 其 中 ,， 有 0、 1、2、3、4 
共 5 个 进程 。 当 这 些 进 程 开 始 运行 时 ， 它 们 均 都 给 出 了 自己 关于 四 类 资源 所 可 能 申请 的 各 种 
资源 实例 的 最 大 数量 ， 具 体 由 图 中 标题 为 Max 的 列 所 给 出 。 举 例 来 说 ， 进 程 1 声称 自己 最 
多 需要 1 个 A 类 资源 实例 、7 个 B 类 资源 实例 和 5 个 C 类 资源 实例 ， 且 不 需要 D 类 资源 实 
例 。 每 个 进程 当前 所 持 有 的 每 种 资源 实例 的 数量 ， 有 具体 由 图 中 标题 为 Alloc 的 列 所 给 出 。 正 
如 我 们 可 以 看 到 的 ， 进 程 2 当前 已 经 分 配 占有 了 1 个 A 类 资源 实例 、3 个 B 类 资源 实例 、5 
个 C 类 资源 实例 和 4 个 D 类 资源 实例 。 进 一 步 说 ， 操 作 系 统 可 以 确定 进程 1 不 会 再 请 求 任 
何 A 类 资源 实例 ， 因 为 它 已 经 分 配 获 得 了 它 所 声称 最 大 需要 的 那么 多 的 相应 实例 。 如 果 进 
程 1 还 要 申请 更 多 的 A 类 资源 实例 ， 我 们 可 以 终止 这 一 进程 。 当 然 ， 进 程 1 还 可 以 再 申请 
7 个 B 类 资源 实例 和 5 个 C 类 资源 实例 ， 不 过 不 能 再 申请 D 类 资源 实例 。 这 些 关 于 进程 运 
行 尚 需 申 请 和 分 配 的 资源 数量 具体 由 图 中 标题 为 Need 的 列 所 给 出 。 操 作 系统 可 以 根据 已 有 
的 这 些 数 据 和 信息 检查 其 是 否 可 以 顺利 地 完成 这 批 作业 ， 而 不 会 发 生死 锁 。 具 体 来 说 ， 我 们 
注意 到 ， 在 当前 情况 下 是 无 法 断定 进程 1 能 不 能 完成 的 ， 因 为 它 还 要 求 男 外 的 7 个 B 类 资 
源 实例 ， 而 我 们 现在 只 有 5 个 B 类 资源 实例 。 但 是 ,我 们 可 以 断定 进程 0 将 能 够 顺利 完成 ， 
因为 该 进程 再 没有 其 他 的 资源 要 求 。 当 进程 0 完成 结束 后 ,我 们 可 以 回收 原先 分 配给 该 进程 
的 资源 一 一 在 这 里 即 为 00 1 2。 于 是 ， 系 统 现 有 可 用 各 类 资源 实例 的 数量 就 变 成 了 1 5 3 2。 
关于 推演 过 程 中 各 类 资源 的 可 用 数量 具体 由 图 中 标题 为 Work 的 列 所 给 出 。 到 目前 为 止 ， 仍 
然 无 法 断定 进程 1 能 否 顺利 完成 ,但 是 我 们 可 以 确定 进程 2 可 以 顺利 完成 了 ， 因 为 它 尚 需 申 
请 的 各 类 资源 的 数量 ( 即 1 00 2 ) 都 比 我 们 现在 所 拥有 的 可 用 资源 数量 ( 即 1532) 少 。 当 
进程 2 完成 结束 后 ,我 们 也 将 回收 其 原先 分 配 占 有 的 资源 ( 即 1 3 5 4 )， 于 是 我 们 拥有 的 可 
用 资源 数量 变 为 2 8 8 6。 现 在 ,我 们 终于 可 以 确定 进程 1 能 够 顺利 完成 了 ， 于 是 我 们 所 拥有 
的 可 用 资源 数量 就 变 成 了 3 8 8 6。 类 似 地 ， 在 现 有 资源 状况 下 ， 我 们 可 以 确定 进程 3 和 进程 
4 能 够 顺利 完成 。 鉴 于 我 们 可 以 确认 所 有 的 进程 都 能 够 顺利 地 完成 ， 所 以 我 们 就 可 以 断定 ， 
系统 当前 处 于 安全 状态 。 


对 于 资源 (A, B, C, D): 现 有 可 用 数量 分 别 为 : 1520 





进程 P0 可 以 顺利 完成 
每 种 资源 足够 使 用 进程 Alloc Max Need 
~wo 0012 0012 0000 
#1 1000 1950 0750 
2 
a 30632 ‘06 O020 
a 4 0014 10656 | 0642 

进程 P1 不 能 完成  “ 

没有 足够 的 B 类 资源 


9-7 ”安全 状态 说 明示 例 


因此 ， 为 了 避免 死 锁 ， 操 作 系 统 必 须 通过 检查 每 个 进程 关于 资源 分 配 的 每 次 请 求 ， 从 
而 确保 如 果 系 统 满足 和 同意 相应 的 资源 申请 ， 系 统 仍 将 处 于 安全 状态 。 不 过 请 注意 ， 一 个 不 
安全 的 状态 并 不 意味 着 我 们 陷 人 了 死 锁 或 者 我 们 肯定 会 陷 人 死 锁 ， 这 仅仅 意味 着 我 们 可 能 最 
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终 会 陷入 死 锁 。 可 以 确定 无 疑 的 是 ， 通 过 始终 不 允许 系统 进入 不 安全 状态 ,我 们 将 会 避免 死 
锁 。 尽 管 如 此 ， 我 们 将 再 次 以 一 种 次 优 的 方式 来 使 用 系统 ， 因 为 我 们 可 能 会 让 有 关 进 程 在 可 
能 成 功 运行 和 没有 死 锁 的 情况 下 等 待 。 我 们 刚刚 非 形 式 化 描述 的 这 种 算法 被 称 为 银行 家 算法 
(Banker's Algorithm)， 它 曾经 被 一 个 称 为 THE 的 操作 系统 ( 译 者 注 : THE 为 “Technische 
Hogeschool Eindhoven” 的 缩写 ， 即 荷兰 语 中 的 埃 因 霍 温 科 技 大 学 ) 使 用 过 。 然 而 ， 对 于 许 
多 系统 来 说 ， 要 预先 知道 每 个 进程 将 会 申请 哪些 资源 和 最 多 申请 多 少 是 不 可 能 的 ， 因 此 死 锁 
避免 方法 在 当前 的 操作 系统 中 并 没有 实际 应 用 。 


9.4.5” 死 锁 检 测 


我 们 解决 死 锁 问题 的 男 一 种 方法 是 ， 让 死 锁 发 生 ， 并且 当 发 生死 锁 时 ， 检 测 到 死 锁 的 
发 生 和 尝试 解除 死 锁 、 恢 复 系统 正常 状态 。 这 种 方法 的 主要 优势 在 于 ， 它 会 让 所 有 的 进程 尝 
试 运行 ， 并 且 从 来 不 会 仅仅 为 了 避免 可 能 的 死 锁 就 使 有 关 进 程 停 下 来 等 待 。 从 这 个 意义 上 来 
说 ， 这 种 方法 是 最 佳 的 。 

如 果 我 们 确实 想 要 就 涉及 每 类 资源 多 个 实例 的 资源 分 配 冲 突进 行 检测 ， 我 们 可 以 利用 与 
银行 家 算法 类 似 的 一 种 算法 。 就 该 算法 来 说 ， 我 们 将 会 审视 当前 申请 但 尚未 分 配 的 资源 量 ， 
而 不 是 尚未 申请 的 最 大 资源 量 。 在 这 种 情况 下 ， 如 果 我 们 不 能 找到 一 个 “安全 状态 ”"， 那 么 
我 们 将 会 认识 到 相关 无 法 完成 的 进程 可 能 卷 人 了 某 种 死 锁 。 然 而 ， 现 在 没有 任何 实际 的 操作 
系统 包含 了 这 样 的 算法 。 相 反 ， 操 作 系 统 把 此 类 算法 留 给 了 那些 担心 死 锁 的 应 用 程序 ， 因 为 
这 些 都 是 实际 会 遇 到 的 死 锁 类 型 。 有 关 的 操作 系统 则 提供 了 一 个 应 用 程序 接口 调用 ， 人 允许 相 
关 应 用 程序 对 所 有 等 待 任务 的 列表 进行 检查 。 这 样 ， 相 关 应 用 程序 就 可 以 检查 所 有 等 待 任务 
并 确认 它们 中 间 是 否 存在 循环 。 事 实 上 ， 这 种 检查 一 般 是 由 运行 用 户 应 用 程序 的 调试 程序 来 
完成 的 。 如 果 对 应 调试 程序 发 现 了 一 个 循环 ， 那 么 程序 员 就 可 以 检查 有 关 数 据 并 解决 相关 
问题 。 


9.4.6 ”抢占 和 其 他 实用 的 解决 方案 


某 些 资 源 是 按照 这 样 的 方式 来 使 用 的 ， 一 旦 某 个 进程 开始 使 用 它们 ， 那么 对 应 进程 就 需 
要 完成 其 正在 完成 的 事情 ， 之 后 我 们 才能 够 使 用 这 些 资 源 。 比 较 不 错 的 例子 如 ， 把 文件 写 人 
磁带 驱动 器 或 者 输出 到 (没有 假 脱 机 技术 支持 的 ) 打印 机 。 其 他 的 资源 则 有 所 不 同 ， 如 随机 
访问 存储 器 ， 即 内 存 。 进 一 步 说 ， 如 果 有 两 个 进程 正在 运行 ， 并 且 每 个 进程 都 需要 比 系统 可 
以 为 其 提供 的 内 存量 还 要 多 的 内 存 ， 那 么 我 们 可 以 暂时 挂 起 其 中 的 一 个 进程 ， 将 该 进程 当前 
在 内 存 中 的 所 有 信息 保存 到 辅助 存储 器 上 ， 然 后 让 另 一 个 进程 拥有 所 有 内 存 。 这 样 ， 当 第 二 
个 进程 完成 结束 后 ， 我 们 再 将 第 一 个 进程 恢复 加 载 到 内 存 ， 分 配给 其 想 要 的 额外 的 内 存 ， 并 
让 其 继续 运行 。 这 种 技术 被 称 为 抢占 ( preemption)。 再 比如 说 ， 在 图 9-5 中 ， 我 们 就 可 以 应 
用 抢占 技术 一 一 让 执勤 警察 要 求 图 中 左下 角 的 汽车 司机 往 后 退 ， 即 抢占 该 汽车 原先 在 街道 上 
的 位 置 一 一 来 解决 格 锁 式 交通 阻塞 。 

那么 接 下 来 的 问题 是 哪些 作业 应 当 被 抢占 。 通 常情 况 下 ， 最 好 的 选择 是 具有 最 小 成 本 
的 那 道 作业 一 一 比如 说 ， 当 前 拥有 足够 大 的 满足 当前 申请 需要 的 但 却 是 最 小 内 存量 的 那 道 作 
业 。 而 如 果 抢占 了 最 大 资源 量 的 进程 还 没有 释放 出 足够 的 资源 使 剩余 的 作业 完成 ， 那 么 就 可 
能 需要 对 下 一 个 比 最 大 资源 量 小 一 点 资源 量 的 进程 来 重复 这 一 抢占 处 理 措 施 。 

但 是 ， 如 果 死 锁 牵 涉 的 所 有 进程 正在 等 待 的 是 无 法 被 抢占 的 资源 ， 那 么 我 们 可 能 别 无 选 
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择 ， 而 只 能 中 止 某 些 或 所 有 相关 进程 。 需 要 说 明 的 是 ,通常 的 选择 一 般 是 中 止 对 应 死 锁 相关 
的 所 有 进程 ， 这 似乎 有 点 不 同 寻常 。 然 而 ， 死 锁 往往 是 一 个 非常 罕见 的 事件 一 一 这 种 事件 是 
如 此 罕见 ， 故 而 使 其 可 能 并 不 值得 花 时 间 去 开发 比较 复杂 的 算法 。 此 外 ， 可 用 来 开发 这 类 算 
法 的 基础 数据 是 非常 稀少 贫乏 的 。 一 种 更 好 的 选择 是 持续 不 断 地 尝试 中 止 最 低 成 本 的 那个 进 
程 ， 直 到 对 应 死 锁 消失 为 止 。 当 然 ， 在 每 次 尝试 之 后 都 应 当 再 次 运行 死 锁 检测 算法 。 

如 前 所 述 ， 最 常用 的 解决 方案 是 忽略 死 锁 问 题 。 遗 憾 的 是 ， 死 锁 所 涉及 的 进程 往往 可 
会 消耗 大 量 的 资源 。 由 于 最 初 陷入 死 锁 的 相关 进程 所 保持 的 死 锁 ， 其 他 的 进程 也 可 能 最 终 
会 停 下 来 加 入 等 待 的 行列 。 从 而 到 最 后 ， 系 统 可 能 停止 运行 任何 进程 。 希 望 系统 操作 员 将 会 
注意 到 有 关 问 题 ， 并 开始 着 手 解决 问题 (可 能 是 通过 中 止 作业 的 方式 )， 直 到 系统 恢复 正常 
运作 。 

在 未 来 ， 似 乎 操作 系统 将 会 包含 更 多 的 机 制 来 应 对 死 锁 。 虽 然 用 于 死 锁 检测 的 算法 确实 
会 需要 和 消耗 一 些 处 理 器 和 内 存 资源 ， 但 是 死 锁 对 于 用 户 来 说 却 是 非常 诡秘 的 一 一 他 们 正在 
使 用 的 系统 看 起 来 只 是 悬 在 那里 ， 而 他 们 竟然 无 能 为 力 ， 既 不 知道 该 如 何 解决 此 类 问题 ， 也 
不 知道 如 何在 将 来 避免 此 类 问题 。 与 此 同时 ， 计 算 机 硬件 不 断 地 获得 更 为 强大 但 又 更 为 低廉 
的 内 存 。 目 前 ， 死 锁 检 测 正在 针对 有 关 调 试 程序 加 以 实现 ， 而 且 我 们 推测 相关 调试 程序 在 将 
来 定 会 找到 它们 作为 后 台 功能 而 进入 内 核 的 途径 。 


9.5 小 结 


在 本 章 中 ,我 们 讨论 了 由 多 个 协作 式 进程 所 组 成 的 系统 的 相关 机 理 。 我 们 从 分 析 为 什么 
系统 经 常 以 这 种 方式 来 进行 构建 而 且 有 关 趋 势 似乎 正在 不 断 增强 的 原因 出 发 来 开启 本 章 的 介 
绍 。 我 们 审视 了 进程 用 来 实现 彼此 相互 通信 的 有 关机 制 。 然 后 ， 我 们 研究 了 当 两 个 进程 之 间 
每 个 进程 都 试图 去 访问 另 一 个 进程 正在 (或 可 能 在 ) 同时 访问 的 数据 时 所 出 现 的 问题 。 我 们 
阐述 了 已 经 开发 出 来 用 于 允许 进程 同步 它们 的 活动 从 而 避免 相关 问题 的 一 些 工 具 。 最 后 ,我 
们 讨论 了 另 一 类 问题 ， 即 当 多 个 进程 使 用 同步 机 制 来 锁定 资源 时 可 能 出 现 的 所 谓 死 锁 问题 。 
我 们 描述 了 防止 死 锁 把 我 们 的 系统 带 向 停止 状态 的 4 种 理论 上 的 相关 机 制 。 

在 下 一 章 中 ,我 们 将 介绍 基本 的 系统 内 存 的 管理 。 
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关于 为 什么 有 时 希望 把 一 个 系统 分 解 成 不 同 的 进程 ， 有 时 运行 在 不 同 的 机 器 上 ， 我 们 列 出 了 如 下 


8 种 原因 。 对 于 其 中 的 每 一 种 原因 ， 请 给 出 一 个 与 课本 中 所 给 例子 不 同 的 另外 的 例子 。 





9.1 
a. 性 能 
b. 规模 扩展 一 一 
c. 已 购买 的 部 件 一 一 
d. 第 三 方 服务 一 一 
e. 多 系统 中 的 组 件 一 一 
f. 可 靠 性 一 一 
g. 信息 的 物理 位 置 一 一 
h. 志愿 式 启用 型 应 用 程序 一 一 
9.2 ”对 于 进程 间 通 信 机 制 的 每 项 特性 来 说 ,一 般 相 
的 相关 各 种 选择 的 优点 和 缺点 : 
a. 可 能 有 多 个 连接 或 单一 连接 一 一 
b. 命名 策略 一 一 
c. 面向 连接 的 通信 或 无 连接 的 通信 一 一 
d. 持久 通信 或 瞬时 通信 一 一 


e. 进程 数 一 一 


应 的 特性 都 会 有 各 种 各 样 的 选择 。 请 讨论 如 下 特性 
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9.3 
9.4 
9.5 
9.6 
927 
9.8 
9.9 


9.10 
9.11 


9.12 


9.13 


9.14 


9.15 


9.16 


17 


9.18 


9.19 
9.20 


9.21 


9.22 


管道 是 阻塞 式 通信 机 制 的 一 个 实例 。 这 是 否 正确 ? 

套 接 字 是 持久 通信 机 制 的 一 个 实例 。 这 是 否 正确 ? 

采用 共享 内 存 进 程 间 通信 机 制 的 最 大 问题 是 什么 ? 

为 什么 同步 问题 很 难 调试 ? 

关于 我 们 所 讨论 过 的 用 于 同步 的 所 有 硬件 锁定 指令 来 说 ， 其 特别 之 处 是 什么 ? 

为 什么 应 用 程序 不 使 用 自 旋 锁 ? 它们 使 用 的 是 什么 ? 

关于 上 锁 和 开锁 的 系统 调用 ， 其 相应 的 标准 的 名 字 是 什么 ? 

a. lock 和 unlock 

b. set 和 clear 

c. wait 和 signal 

d. enter 和 exit 

e. 以 上 均 不 是 
有 些 特殊 的 信号 量 称 为 计数 型 信号 量 。 它 们 是 用 来 完成 什么 事情 的 ? 
当 运 行 在 对 称 多 处 理 系统 上 时 ， 应 用 程序 必须 采取 特殊 的 预防 措施 来 确保 任何 锁 的 取 值 可 被 所 
有 的 处 理 器 看 到 。 这 是 否 正确 ? 
简要 描述 优先 级 倒置 的 概念 。 
什么 引发 了 高 级 语言 中 管 程 的 开发 ? 
死 锁 发 生 需 要 三 个 条 件 。 它 们 是 什么 ? 
我 们 说 过 ， 对 于 死 锁 的 发 生 而 言 ， 存 在 一 个 进程 序列 ， 其 中 每 一 个 进程 持 有 一 个 资源 ， 同 时 还 
在 等 待 着 下 一 个 进程 所 持 有 的 另 一 个 资源 ， 且 最 后 一 个 进程 等 待 着 第 一 个 进程 所 持 有 的 资源 。 
试问 多 少 个 进程 创造 了 一 个 死 锁 ? 
有 些 设备 是 不 可 共享 的 ， 但 是 我 们 找到 了 一 种 构建 虚拟 设备 的 方法 ， 人 允许 我 们 假装 成 是 在 共享 
相关 设备 。 那 种 机 制 是 什么 ? 
关于 各 种 资源 所 对 应 的 锁 的 排序 能 够 消除 循环 等 待 ， 从 而 消除 死 锁 。 什 么 时 候 这 种 技术 可 以 使 
用 ? 而 什么 时 候 这 种 技术 不 可 以 使 用 ? 
我 们 讨论 过 两 种 不 同类 型 的 死 锁 避免 。 一 般 而 言 ， 死 锁 避 免 存在 什么 问题 呢 ? 

关于 死 锁 检测 的 算法 众所周知 且 不 难 编写 ， 但 为 什么 我 们 不 经 常 使 用 呢 ? 

方便 “抢占 ”方法 使 用 上 且 效 果 很 好 的 例子 是 什么 ? 


可 能 要 求 拓展 阅读 的 问题 : 

现代 操作 系统 出 于 不 同 的 目的 而 使 用 了 若干 不 同类 型 的 信号 量 。 挑 选 一 种 现代 的 操作 系统 ， 说 
出 其 所 支持 的 一 些 不 同类 型 的 信号 量 的 名 字 ， 并 分 别 给 以 简要 的 解释 说 明 。 

有 许多 牵涉 同步 的 经 典 问题 ,我 们 已 经 描述 了 两 个 。 你 能 找 出 我 们 描述 了 哪 两 个 经 典 同步 问题 
吗 ? 而 其 他 的 经 典 同步 问题 又 有 哪些 呢 ? 


| 第 10 章 


Operating Systems: A Spiral Approach 


基本 的 内 存 管理 





10.1 为 什么 要 管理 主 内 存 


在 前 面 的 两 章 中 ， 我 们 讨论 了 操作 系统 必须 要 完成 的 一 项 主要 工作 ， 即 管理 在 处 理 器 上 
运行 的 进程 。 在 本 章 中 ,我 们 将 讨论 操作 系统 的 第 二 项 主要 工作 ， 即 管理 主 内 存 ( primary 
memory， 简 称 主 存 或 内 存 )。 与 所 有 系统 资源 一 样 ， 操 作 系统 尝试 管理 系统 的 主 存 。 通 常情 
况 下 ， 主 存 是 由 电子 电路 制 成 的 随机 访问 存储 器 (Random Access Memory，RAM) 9。 内 存 
管理 的 基本 目标 是 允许 尽 可 能 多 的 进程 运行 。 操 作 系统 提供 应 用 程序 接口 函数 ， 以 允许 我 们 
分 配 、 访 问 和 回收 内 存 。 当 内 存 被 分 配给 进程 时 ， 操 作 系 统 必 须 监 测 记 录 内 存 的 哪些 部 分 是 
空闲 的 、 哪 些 部 分 是 被 分 配 的 以 及 相关 部 分 被 分 配给 了 哪些 进程 。 操 作 系 统 有 时 也 可 能 从 进 
程 那里 抢占 内 存 。 在 这 种 情况 下 ， 它 必须 准备 在 辅助 存储 器 ( secondary memory) 上 保存 主 
存 的 当前 内 容 ， 记 录 每 个 进程 的 各 部 分 内 容 的 存储 位 置 ， 以 及 当 被 抢占 的 进程 恢复 时 恢复 主 
存 的 内 容 。 

在 大 多 数 情况 下 ， 操 作 系 统 将 尝试 以 对 应 用 程序 透明 的 方式 来 管理 内 存 。 然 而 ， 我 们 后 
面 在 下 一 章 中 将 会 注意 到 ， 在 某 些 情况 下 ， 这 种 透明 是 不 彻底 的 。 对 于 试图 优化 性 能 的 大 型 
系统 来 说 ， 关 于 内 存 服务 的 幼稚 使 用 有 时 可 能 会 导致 相关 问题 的 发 生 。 事 实 上， 我 们 学 习 操 
作 系 统 的 一 个 主要 理由 就 是 要 获得 必要 的 信息 和 理解 能 力 ， 以 克服 这 些 问 题 。 

在 讨论 了 为 什么 我 们 要 管理 内 存 之 后 ,我们 在 第 10.2 节 中 ， 将 会 阐明 一 个 进程 的 传统 
开发 和 运行 周期 模型 ， 以 及 把 一 道 程序 中 的 某 一 项 的 引用 绑 定 到 存储 该 项 的 物理 内 存 位 置 的 
相关 步骤 。 而 我 们 后 面 将 会 使 用 这 些 步 又 来 解释 各 种 各 样 的 内 存 管理 机 制 。 其 后 ， 我 们 将 会 
从 第 10.3 节 中 的 单一 进程 开始 ， 逐 渐 展 开 讨 论 在 越 来 越 复杂 的 情况 下 的 内 存 管理 ， 包 括 讨 
论 诸 如 重 定位 和 覆盖 等 各 个 方面 。 接 下 来 ， 我 们 转向 牵涉 多 个 进程 的 情况 ， 再 次 渐进 式 地 讨 
论 越 来 越 复杂 的 相关 机 制 ， 包 括 在 第 10.4 节 中 的 针对 固定 数量 的 进程 的 管理 以 及 在 第 10.5 
节 中 的 针对 可 变数 量 的 进程 的 管理 。 最 后 ， 我 们 对 全 章 内 容 进 行 了 归纳 总 结 。 


10.2 ”开发 周期 步骤 与 绑 定 模型 


首先 ， 让 我 们 描述 构建 一 个 应 用 程序 ， 将 其 加 载 到 内 存 并 予以 运行 的 相关 步骤 的 标准 模 
型 。 在 本 章 的 后 续 各 节 中 ， 我 们 将 使 用 这 个 模型 围绕 如 何 管理 进程 使 用 内 存 的 方式 来 解释 操 
作 系统 的 相关 常见 功能 。 

实际 上 ， 以 一 个 进程 在 内 存 中 运行 为 结局 的 相关 事件 序列 共 由 5 个 步骤 组 成 。 第 一 
步 ， 我们 编写 (或 编码 ) 对 应 程序 。 通 常 这 是 利用 某 种 符号 语言 来 完成 的 ,或 者 是 低级 的 汇 


日” 系统 有 可 能 是 使 用 其 他 类 型 的 主 存 构建 的 。 例 如 ， 早 期 的 系统 就 曾 使 用 了 水 银 模 中 的 声波 或 旋转 的 磁 鼓 。 
曾 有 一 些 年 ， 几 乎 所 有 的 计算 机 系统 都 使 用 了 和 氧化 铁 芯 中 的 磁化 极 性 来 存储 位 。 短 语 “ 核 心 转 储 ” 一 一 
对 分 配给 一 个 已 经 崩溃 的 程序 的 内 存 的 内 容 的 打印 输出 一 一 就 源 自 这 个 时 代 。 这 种 内 存 具 有 即使 在 电源 
关闭 时 仍然 保留 其 内 容 的 特性 。 今 天 ， 这 作为 一 项 特有 的 属性 吸引 着 我 们 ， 因 为 我 们 通常 认为 主 存 是 易 
失 性 的 。 
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编 语 言 ， 或 者 是 高 级 的 面向 问题 的 语言 。 第 二 步 ， 我 们 使 用 一 种 翻译 程序 ， 通 常 是 汇编 程 
序 或 编译 程序 ， 但 偶尔 也 会 是 解释 程序 ( 译 者 注 : 此 三 者 对 应 英文 术语 分 别 为 assembler、 
compiler 、interpreter， 或 分 别称 为 汇编 器 、 编 译 器 和 解释 器 )， 将 这 个 符号 程序 转换 
(translate) 成 目标 机 器 的 指令 序列 ， 创 建 一 个 “目标 模块 ” 。 然 而 通常 情况 下 ， 这 个 目标 模 
块 尚 不 能 直接 运行 。 第 三 步 ， 我 们 一 般 会 将 该 模块 与 各 个 单独 创建 的 类 似 的 模块 进行 链接 
(link)。 这 些 模块 可 能 是 我 们 创建 的 其 他 模块 ， 也 可 能 是 我 们 购买 的 或 者 与 操作 系统 一 起 提 
供 的 库 模块 。 第 四 步 ， 我 们 将 上 一 步 链接 形成 的 对 应 程序 加 载 (load) 到 内 存 中 。 第 五 步 ， 
我 们 真正 运行 (run) 这 个 程序 。 

请 注意 这 些 步 又 的 名 称 : 在 历史 上 曾经 设计 和 出 现 过 许多 不 同 的 软件 包 ， 用 来 辅助 程序 
设计 人 员 实 现 一 个 程序 。 因 为 不 同 的 系统 一 般 被 用 于 解决 不 同 环 境 中 的 不 同 问题 ， 所 以 其 中 
一 些 步骤 的 功能 有 了 时 就 被 组 合成 某 一 单个 的 模型 。 我 们 所 描述 的 把 相关 模块 组 合 在 一 起 的 功 
能 通常 被 称 为 链接 ( linking)， 而 把 有 关 进 程 带 入 内 存 的 功能 通常 被 称 为 加 载 (loading)。 然 
而 ， 有 些 时 候 ， 这 些 功 能 可 能 在 一 个 步骤 中 就 可 完成 。 在 其 他 的 文献 中 ， 你 可 能 会 看 到 某 一 
个 词 用 来 描述 某 一 个 步骤 ， 或 者 是 用 来 同时 描述 这 两 个 步骤 的 组 合 。 

假设 我 们 正在 创建 由 两 个 模块 组 成 的 一 个 进程 。 我 们 拥有 一 个 主 程序 ， 其 中 调用 了 我 
们 先前 所 编写 的 名 为 XYZ 的 子 程序 。 在 学 习 越 来 越 复 杂 的 模型 时 ， 绑 定 问题 将 是 我 们 重点 
关注 的 。 绑 定 (binding) 就 是 指 确定 子 程序 应 当 放 在 物理 内 存 的 什么 地 方 并 使 主 程序 中 的 有 
关 引 用 指向 相应 子 程序 的 过 程 。 但 是 ， 对 于 并 非 主 程序 一 部 分 的 所 有 项 的 引用 ， 都 会 发 生 绑 
定 ， 也 就 是 说 这 里 的 项 不 仅仅 是 子 程序 项 ， 还 包括 数据 项 。 


10.3 单一 进程 
10.3.1 编码 时 绑 定 


对 于 像 具 有 非常 小 的 基本 输入 /输出 系统 (BIOS) 的 嵌入 式 系 统 这 样 的 非常 简单 的 运行 
环境 ， 我 们 可 能 通过 手工 方式 就 可 以 确定 程序 的 每 一 部 分 会 放 到 什么 地 方 或 位 置 。 我 们 可 
能 将 主 模块 放 在 位 置 100， 而 将 子 程序 XYZ 放 在 位 置 500。 如 果 我 们 采用 汇编 语言 来 编写 
主 模块 ， 那 么 我 们 可 能 包含 像 ORG 100 这 样 的 汇编 指令 ， 而 在 子 程序 中 则 可 能 包含 一 条 汇 
编 指令 为 ORG 500。 这 些 指 令 便 会 导致 汇编 器 生成 以 绝对 方式 引用 这 些 内 存 地 址 的 相应 代 
码 。 于 是 ， 在 我 们 的 主 模块 中 ， 我 们 就 会 知道 子 程序 XYZ 将 被 放 在 地 址 500， 故 而 我 们 实 
际 上 就 可 以 用 针对 位 置 500 的 调用 请 求 来 替代 针对 XYZ 的 调用 请 求 。 在 这 种 情况 下 ， 我 们 
在 编码 步骤 便 可 完成 绑 定 决策 ， 并 且 是 通过 ORG 指令 把 相关 结果 告诉 了 汇编 器 。 今天 ， 这 
对 我 们 看 来 似乎 不 太 可 能 ， 但 这 绝对 算 不 上 早期 绑 定 的 一 个 极端 例子 。 下 面 说 明 三 个 极端 的 
例子 : 

当 计 算 机 首次 研制 出 来 时 ， 以 及 当 小 型 计算 机 和 个 人 计算 机 首次 研制 出 来 时 ， 第 一 批 系 
统 拥有 非常 小 的 软件 和 很 少 的 外 围 设备 。 程 序 员 不 仅仅 是 手工 分 配 地 址 ， 而 且 还 是 在 用 机 器 
语言 编写 程序 ， 甚 至 是 通过 操作 机 器 前 面 的 控制 板 上 的 开关 和 按钮 手动 将 有 关 程 序 输 入 存储 
器 中 。 在 某 些 机 器 中 ， 还 有 使 用 固定 内 存 地 址 作为 缓冲 区 的 外 围 设备 ， 故 而 程序 员 甚 至 都 别 
无 选择 。 不 用 说 ， 让 程序 员 以 手工 方式 来 分 配 内 存 是 容易 出 错 且 耗 费时 间 的 事情 。 这 个 阶段 
并 没有 持续 很 长 的 时 间 。 

IBM 650 计算 机 系统 拥有 一 个 主 存 ， 且 是 一 个 旋转 的 磁 鼓 。 有 关 指 令 的 执行 一 般 会 花费 
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可 变 长 度 的 时 间 。 当 然 ， 在 对 应 指令 执行 的 过 程 中 ， 磁 鼓 仍然 在 继续 旋转 。 为 此 ， 每 条 指 
令 往往 会 包含 一 个 字段 以 用 于 给 出 下 一 条 指令 的 地 址 。 而 程序 员 不 得 不 尝试 通过 将 下 一 条 指 
令 放 置 在 当前 指令 完成 时 的 磁 鼓 读 取 头 下 方 的 下 一 个 位 置 来 优化 程序 。 显 然 ， 这 一 阶段 也 
没有 持续 很 长 的 时 间 。 期 间 ， 在 哥伦比亚 大 学 开发 了 一 个 名 为 SOAP ( Symbolic Optimizing 
Assembler Program， 符 号 优化 式 汇编 程序 ) 的 汇编 器 ， 其 主要 工作 就 是 实现 相关 指令 在 磁 鼓 
上 的 优化 放置 。 

在 程序 被 例行公事 地 以 打 孔 方式 记录 到 卡片 上 并 且 没 有 磁带 或 旋转 式 存储 器 可 用 的 时 
间 里 ， 将 汇编 程序 加 载 到 存储 器 、“ 喂 进 ” 源 程序 、 获 取 以 打 孔 方式 记录 到 卡片 上 的 目标 模 
块 、 将 链接 程序 (linker program) 加 载 到 存储 器 、 将 对 应 目标 模块 “ 喂 给 ”链接 程序 、 以 
打 孔 方式 把 可 执行 程序 ( executable program) 记录 到 卡片 上 ， 以 及 最 后 将 目标 程序 (object 
program) 加 载 到 计算 机 上 加 以 运行 ， 这 是 一 个 相当 复杂 的 过 程 。 因 此 ,针对 以 打 孔 方式 记 
录 到 卡片 上 的 可 执行 程序 进行 修补 ， 即 打 补 本 (patch)， 是 司空 见 惯 的 事情 。 鉴 于 有 关 的 汇 
编 清 单 包 含有 对 应 于 每 条 指令 而 输出 的 机 器 语言 ， 这 便 允 许 程序 员 找 到 包含 不 正确 指令 的 卡 
片 ， 将 其 加 载 到 一 个 键 控 打 孔 机 上 ， 并 通过 直接 更 改 对 应 的 机 器 语言 来 修复 程序 。 遗 憾 的 
是 ， 这 种 做 法 确实 持续 了 一 段 时 间 ， 而 且 也 很 容易 出 错 。 此 外 ， 由 此 导致 程序 员 将 会 在 一 有 登 
卡片 中 插入 多 个 补丁 ， 最 终 ， 补 丁 的 数量 将 会 变 得 非常 策 抽 和 极 不 便利 ， 所 以 程序 员 只 好 返 
回 到 源码 卡片 登 ， 针 对 源 程序 重复 所 有 的 更 改 处 理 ， 然 后 重新 执行 汇编 等 一 系列 过 程 。 遗 憾 
的 是 ， 漏 掉 针 对 源 代 码 的 一 两 处 更 正 又 是 太 过 容易 的 事情 ， 因 此 发 现 有 人 在 源 代码 中 修补 他 
自己 已 经 用 补丁 修复 过 的 错误 ， 这 样 的 情况 并 不 罕见 。 


10.3.2 ”链接 时 绑 定 


在 CP/M 运行 环境 中 ， 所 有 程序 都 应 该 从 位 置 100 开始 ， 因 此 在 主 模块 中 ， 可 能 包含 
ORG 100 这 样 的 语句 。 同 时 ， 我 们 可 能 并 不 关心 子 程序 XYZ 在 哪里 结束 ， 所 以 在 主 例 程 
中 我 们 可 以 使 用 符号 名 称 XYZ。 当 汇编 器 输出 目标 模块 时 ， 其 中 包含 所 有 的 指令 和 数据 ， 
同时 还 包含 某 些 信息 用 来 告诉 链接 程序 ， 即 我 们 有 一 些 引用 需要 其 进行 修复 或 链接 。 当 链 
接 程 序 处 理 主 例 程 后 ， 它 将 会 拥有 一 张 其 需要 解析 的 名 称 列 表 ， 然 后 它 将 开始 处 理 我 们 先 
前 告诉 它 的 那些 应 包含 的 其 他 模块 。 伴 随 它 在 加 载 步骤 中 真正 包含 这 些 模块 ， 它 将 在 那些 
模块 中 找到 在 其 中 所 定义 的 名 称 。 在 这 个 例子 里 ,，“ XYZ” 的 定义 将 会 出 现在 我 们 先前 告 
诉 链接 程序 进行 处 理 的 某 个 模块 中 。 当 链接 程序 计算 和 确定 模块 XYZ 在 地 址 空间 中 的 位 
置 时 ， 它 将 返回 去 把 主 模块 中 的 相关 引用 链接 (或 绑 定 ) 到 对 应 子 例 程 模块 中 的 地 址 上 。 
现在 ， 我 们 是 在 链接 时 而 不 是 编码 时 才 完 成 了 绑 定 决 策 。 请 注意 ， 当 我 们 把 绑 定 推迟 到 后 
面 的 步骤 时 ， 我 们 获得 了 一 定 程 度 上 的 灵活 性 。 如 果 我 们 在 编码 时 就 已 决定 把 模块 XYZ 
放 在 位 置 500， 而 后 来 发 现 需要 将 该 模块 移动 到 其 他 位 置 时 ， 我 们 将 不 得 不 花费 很 多 精力 
来 修正 关于 这 一 地 址 的 所 有 的 引用 。 但 让 链接 程序 来 决定 模块 的 存放 位 置 将 使 得 这 一 切 变 
得 非常 方便 和 容易 。 不 过 话 又 说 回来 ， 为 了 灵活 性 的 增强 ， 我 们 还 是 付出 了 一 些 代价 的 。 
进一步 说 ， 在 这 种 情况 下 ， 我 们 需要 在 目标 模块 中 增加 额外 的 信息 用 来 定义 相关 名 称 以 
及 有 关 名 称 的 引用 ， 并 且 我 们 在 链接 步骤 中 为 其 所 做 的 绑 定 会 花费 一 些 额 外 的 时 间 。 尽 
管 如 此 ， 随 着 计算 机 的 运行 速度 变 得 更 为 迅捷 而 存储 空间 变 得 越 来 越 大 ， 需 要 付出 的 这 
种 额外 的 时 间 和 空间 的 开销 已 经 变 得 微不足道 ， 以 至 于 我 们 很 可 能 甚至 都 不 会 把 它 放 在 
心 上 。 
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10.3.3 ”单一 进程 


在 CP/M 运行 环境 中 ， 操 作 系统 位 于 内 存 的 顶端 ， 而 应 用 程序 从 位 置 100 开始 ， 以 避 开 
放置 在 低 端 内 存 中 的 中 断 向 量 (interrupt vector)， 并 按 向 上 方向 增长 。 遗 憾 的 是 ， 随 着 操作 
系统 变 得 越 来 越 大 (而且 它 总 是 如 此 )， 有 可 能 最 后 变 得 很 大 ， 以 至 于 升级 后 的 操作 系统 可 
能 使 用 了 升级 之 前 曾经 运行 良好 的 应 用 程序 所 需要 的 内 存 。 于 是 ， 系 统 将 会 发 生前 溃 ， 并 且 
有 可 能 连 什 么 问题 都 说 不 清楚 。 因 此 ， 微 软 DOS 操作 系统 采取 了 一 种 不 同 的 方法 : 操作 系 
统 被 加 载 到 低 端 内 存 ， 而 应 用 程序 加 载 到 它 上 面 的 位 置 。 当 应 用 程序 试图 加 载 时 ， 如 果 有 足 
够 的 空闲 可 用 内 存 ， 那 么 对 应 程序 将 进行 加 载 并 准予 运行 。 但 如 果 没 有 足够 内 存 ， 那 么 至 少 
对 应 故障 已 被 明确 判定 。 最 初 ， 当 有 人 在 微软 DOS 操作 系统 下 创建 应 用 程序 时 ， 对 应 链接 
生成 的 程序 只 能 在 特定 版 本 的 操作 系统 上 运行 。 链 接 过 程 中 确定 了 操作 系统 中 的 相关 服务 例 
程 的 地 址 以 及 应 用 程序 应 当 开 始 加 载 的 地 址 。 遗 憾 的 是 ， 这 便 意味 着 ， 当 常 驻 操作 系统 的 绝 
对 大 小 发 生 改 变 的 新 版 微软 DOS 操作 系统 发 布 的 情况 下 ， 所 有 的 应 用 程序 必须 得 重新 链接 
之 后 才能 在 新 版 操作 系统 上 运行 。( 译 者 注 : 其 实 ， 如 果 新 版 操作 系统 中 相关 服务 例 程 地 址 
发 生变 化 ， 即 使 其 常 驻 操作 系统 的 绝对 大 小 没有 发 生变 化 ， 有 关 应 用 程序 也 需 重新 链接 。) 

许多 大 型 机 操作 系统 具有 类 似 的 体系 结构 ， 但 它们 利用 了 额外 的 硬件 来 保护 自身 。 在 
图 10-1 中 ， 我 们 可 以 看 到 一 个 典型 的 早期 操作 系统 的 体系 结构 ， 那 是 只 支持 一 个 进程 运行 
的 一 台大 型 机 的 体系 结构 。 可 执行 程序 将 会 被 创建 和 驻 留 在 操作 系统 内 核 上 方 的 某 一 特定 
地 址 。 此 外 ， 一 个 基 址 寄存 器 ( base register) 将 会 用 某 个 地 址 高 端 内 存 
加 载 设 定 ， 且 可 执行 程序 不 能 寻 址 低 于 该 地 址 的 空间 。 如 果 程 
序 确实 引用 了 这 一 地 址 以 下 的 内 存 ， 就 会 产生 一 个 中 断 并 终止 应 用 程序 
对 应 程序 。 这 样 的 系统 仍然 会 存在 问题 ， 因 为 如 果 操 作 系 统 变 
大 ， 那 么 应 用 程序 将 不 得 不 根据 新 的 地 址 来 进行 链接 。 这 一 问 “ 基 址 寄存 器 
题 的 解决 方案 是 稍微 改变 一 下 基 址 寄存 器 的 功能 。 有 


10.3.4 ”动态 重 定位 图 10-1 单一 进程 的 操作 系统 


有 关 寄 存 器 功能 的 变化 也 导致 了 相应 名 称 的 改变 ， 曾 经 所 谓 的 基 址 寄存 器 现在 则 称 为 重 
定位 寄存 器 (relocation register)， 如 图 10-2 所 示 。 加 载 到 该 寄存 器 中 的 数值 不 再 是 一 个 界限 
值 。 相 反 ， 可 执行 程序 是 按照 其 好 像 定 位 于 地 址 0 来 运行 而 创建 的 ， 并 且 重 定位 寄存 器 中 的 
数值 将 会 加 到 由 对 应 程序 所 做 的 每 个 内 存 引用 地 址 上 。 为 此 ， 程 序 现 在 没有 必要 在 每 次 操作 
系统 发 生变 化 时 就 进行 重新 链接 ， 因 为 每 个 内 存 引用 会 在 程序 运行 时 自动 地 重新 定位 。 





图 10-2 单一 进程 的 操作 系统 (需要 重 定位 硬件 的 支持 ) 


颂 10 足 堆 杰 的 内 阅 党 理 175 


10.3.5 ”物理 内 存 空间 与 逻辑 内 存 空间 


这 项 新 的 重 定位 功能 引入 了 一 个 重要 的 概念 : 逻辑 地 址 空间 和 物理 地 址 空间 之 间 的 差 
异 。 原 来 ， 当 我 们 编译 一 个 程序 时 ， 我 们 是 创建 了 一 个 程序 且 该 程序 将 会 按照 在 翻译 步 又 或 
链接 步骤 中 为 其 分 配 的 地 址 而 被 加 载 到 内 存 。 可 执行 程序 被 编译 成 是 引用 了 与 实际 物理 存储 
器 (内存) 地 址 一 一 对 应 的 一 系列 地 址 。 虽 然 这 一 点 在 硬件 演化 方面 还 不 太 清 晰 ， 但 实际 上 
存在 两 个 不 同 的 地 址 空间 在 被 使 用 。 第 一 个 地 址 空间 是 在 程序 执行 时 由 处 理 器 所 生成 的 地 址 
集 ， 这 个 地 址 空间 称 为 逻辑 地 址 空间 。 而 我 们 最 后 将 把 可 执行 程序 加 载 到 主 存 中 ， 用 来 访问 
这 一 存储 器 的 地 址 集 则 称 为 物理 地 址 空间 。 当 我 们 引入 重 定位 寄存 器 时 ， 这 一 点 已 变 得 非常 
清楚 ， 即 程序 的 逻辑 地 址 空间 和 它 的 物理 地 址 空间 是 不 同 的 ， 我 们 从 图 10-2 中 可 以 看 出 来 。 
磁盘 上 的 可 执行 程序 是 按照 生成 以 零 作 为 低地 址 的 相关 地 址 而 被 创建 的 。 但 是 ， 当 程序 被 定 
位 到 存储 器 中 时 ， 其 实际 上 是 被 加 载 到 物理 内 存 地 址 10000 的 位 置 。 在 程序 运行 时 ， 存 储 器 
地 址 硬件 将 会 对 由 程序 产生 的 逻辑 地 址 进行 动态 的 重新 定位 ， 具 体 通过 加 上 重 定 位 寄存 器 中 
的 数值 ， 从 而 把 逻辑 地 址 空间 映射 到 了 物理 地 址 空间 中 。 图 10-3 给 出 了 关于 对 应 进程 的 一 
个 更 为 具体 的 示例 。 当 应 用 程序 在 处 理 器 中 运行 时 ， 其 会 生成 一 个 内 存 引用 ， 这 可 能 是 程序 
中 下 一 条 指令 的 地 址 、 一 个 子 程序 调用 的 地 址 、 一 个 数据 项 的 引用 地 址 或 许多 其 他 东西 的 地 
址 。 在 这 个 例子 里 ， 相 应 引用 是 对 应 程序 的 逻辑 地 址 空间 中 的 地 址 456。 然 而 ， 操 作 系 统 已 
经 把 该 程序 的 起 始 物理 地 址 (本 例 中 即 10000 ) 加 载 到 了 重 定位 寄存 器 中 。 于 是 ， 存 储 器 硬 
件 将 重 定位 寄存 器 中 的 数值 加 到 该 逻辑 地 址 上 ， 从 而 生成 了 物理 地 址 10456。 


10.3.6 程序 比 内 存 大 


随 着 时 间 的 流逝 ， 内 存 已 经 变 得 非常 便宜 了 。 但 曾几何时 ， 主 存在 一 个 系统 的 总 价格 中 
常常 占有 非常 大 的 部 分 。 因 而 ， 大 多 数 早期 的 系统 往往 只 有 相当 小 的 主 存 。 无 论 是 大 型 机 、 
小 型 机 还 是 早期 的 微机 ， 其 主要 的 内 存 度 量 单位 为 千 字 (Kiloword) 或 千 字 节 (Kilobyte， 简 
记 作 KB )， 而 不 是 千 兆 字 节 ( Gigabyte， 简 记 作 GB)， 这 在 当时 是 相当 普遍 的 情况 。 正 因 如 ”14 
此 ， 程 序 设计 人 员 花 费 了 很 多 时 间 试 图 将 更 多 的 功能 或 更 多 的 信息 挤 进 很 小 的 内 存 空 间 里 。 
例如 ， 正 是 这 种 压力 导致 了 千年 虫 (Y2K) 问题 。 当 时 程序 员 的 自然 想法 是 ， 既 然 还 有 30 年 
左右 的 时 间 才 会 是 以 “19” 之 外 的 其 他 数字 打头 的 年 份 ， 为 什么 要 为 了 每 个 日 期 而 浪费 内 存 
来 存储 这 两 个 额外 的 数字 呢 ? 今天 ， 我 们 可 能 仍然 必须 要 应 对 拥有 有 限 主 存 的 嵌入 式 系统 ， 
但 通常 这 是 出 于 空间 或 功率 要 求 的 原因 ， 而 不 是 因为 存储 器 的 价格 。 


10.3.7 覆盖 


程序 设计 人 员 经 常 需要 为 那些 在 小 内 存 中 运行 的 程序 增 
加 某 些 功能 。 设 计 一 个 由 如 下 三 部 分 组 成 的 程序 曾经 是 (并 
且 依 然 是 ) 相当 普遍 的 : 首先 是 初始 化 代码 部 分 ， 然 后 是 一 
个 主要 的 计算 循环 ， 最 后 是 关于 某 种 总 结 报告 的 代码 部 分 。 
鉴于 程序 设计 人 员 认 识 到 这 类 程序 的 上 述 部 分 并 不 需要 同时 
驻 留 在 内 存 空间 ， 所 以 他 们 决定 让 有 关 程 序 的 这 些 部 分 在 内 
存 中 相互 重 和 到 或 覆盖 。 图 10-4 就 给 出 了 这 样 的 一 个 程序 。 该 图 10-3 ”基于 存储 器 地 址 硬件 的 
程序 的 主体 部 分 只 是 对 实现 上 述 三 个 组 成 部 分 的 子 程序 的 一 ” 当 辑 地 址 空间 到 物理 地 
系列 调用 ， 为 方便 起 见 ， 不 妨 设 定 相 关子 程序 名 字 分 别 为 址 空间 的 动态 映射 
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“init”、“ main-loop” 和 “wrap-up”。 同 时 ,该 程序 里 需要 添加 上 对 操作 系统 加 载 函 数 的 相 
应 的 调用 ， 以 便 在 调用 各 子 程序 之 前 首先 实现 对 应 各 子 程序 的 加 载 。 程 序 主体 部 分 常 驻 在 存 
储 器 中 ， 而 其 他 部 分 则 是 在 被 调用 之 前 加 载 到 内 存 的 。 在 精巧 复杂 的 交互 式 系统 中 ， 这 可 能 
会 有 点 复杂 和 车 手 。 而 对 于 像 汇编 器 或 编译 器 这 样 的 简单 程序 来 说 ， 即 便 不 使 用 覆盖 技术 ， 
也 可 能 会 比较 轻而易举 地 被 加 载 到 内 存 中 , 但是， 如果 将 其 分 解 成 若干 阶段 和 子 程序 ， 则 将 
会 允许 相关 转换 机 制 能 够 在 给 定 的 存储 空间 中 处 理 较 大 的 源 程序 。 






调用 操作 系统 函数 以 加 载 “init” 子 程序 
J Dy ah- loop” 子 程序 

本 调用 gainalggp" 子 程序 。 -和 

调用 操作 on “wrap-up” 子 程序 

: “” ”调用 “wrap-up” 子 程序 

图 10-4 aa 二 


10.3.8 ”对 换 


伴随 主 存 价格 的 下 降 〔 相 对 于 计算 机 的 其 余部 分 而 言 )， 计 算 机 管理 人 员 着 手 审视 正在 
发 生 的 一 切 ， 并 进而 意识 到 ， 由 于 只 有 一 个 程序 运行 ， 所 以 他 们 没有 让 自己 非常 昂贵 的 系统 
得 到 很 好 的 利用 。 特别 是 有 些 程序 会 执行 较 少 的 输入 7 输出 操作 但 会 计算 很 长 时 间 ， 于 是 外 
围 设备 没有 得 到 充分 的 利用 ; 相反， 有 些 程序 则 主要 完成 输入 /输出 任务 而 只 有 非常 少 的 处 
理 器 运行 任务 ， 故 而 这 些 程序 在 执行 过 程 中 常常 需要 等 待 输入 / 输出 操作 完成 ， 处 理 器 的 利 
用 因此 受到 了 极 大 的 影响 。 在 这 种 背景 下 ， 假 脱 机 等 一 些 技术 应 运 而 生 。 具 体 而 言 ， 在 单一 
进程 批 处 理 系统 中 ， 操 作 系统 可 以 读 取 包含 有 要 运行 的 下 一 道 程序 及 相关 联 数据 的 卡片 并 将 
它们 存储 到 磁盘 上 ， 目 这 一 读 取 过 程 应 当 与 当前 作业 的 执行 过 程 在 时 间 上 相 重奏 。 当 某 道 作 
业 试图 打印 其 对 应 输出 时 ， 被 打印 的 各 行内 容 将 被 存储 在 磁盘 文件 中 ,并 且 真 正 的 打印 过 程 
将 与 下 一 道 作 业 的 处 理 过 程 在 时 间 上 相 重音 。 

然而 到 后 来 人 们 意识 到 ， 即 便 是 假 脱 机 技术 也 是 不 够 的 一 一 依然 存在 大 量 的 处 理 器 周期 
和 输入 /输出 时 间 的 遗失 和 浪费 。 而 同时 运行 多 
道 程序 则 似乎 是 不 错 的 解决 方案 。 也 就 是 说 ， 希 * 
望 一 些 程序 正在 计算 的 同时 而 其 他 程序 正在 进行 
输入 /输出 ， 于 是 整 台 机 器 将 会 保持 更 为 忙碌 的 
工作 状态 。 对 于 当时 花费 一 百 万 美元 购 得 的 机 器 
来 说 ， 这 是 相当 可 取 的 。 这 时 候 ， 在 计算 机 的 历 应 用 
史上 ， 大 多 数 的 系统 已 经 拥有 了 由 磁盘 或 磁 鼓 组 程序 
成 的 辅助 存储 器 。 对 换 ( swapping) 技术 成 为 保 
持 若干 程序 同时 运行 的 第 一 种 技术 ， 相 关 工 作 机 
理 如 图 10-5 所 示 。 根 据 图 示 ， 程序 A 当前 正在 图 10-5 具有 对 换 功 能 的 操作 系统 示例 
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主 存 中 运行 。 假 定 该 程序 请 求 系统 要 在 打印 机 上 打印 一 行 ， 且 这 一 操作 至 少 需 要 百 分 之 一 
秒 。 在 这 个 时 候 ， 我 们 可 以 做 许多 的 磁盘 输入 /输出 操作 和 大 量 的 计算 ， 所 以 我 们 通过 将 主 
存 的 内 容 写 到 磁盘 上 来 把 程序 A 换 出 外 存 ， 同 时 把 程序 B 换 进 内 存 。 接 下 来 我 们 让 程序 B 
运行 ， 直 到 它 发 出 一 个 针对 低速 设备 的 输入 /输出 操作 请 求 ， 然 后 我 们 再 将 程序 B 交换 出 内 
存 ， 并 将 程序 A 换 进 内 存 。 对 换 技 术 有 时 也 称 为 滚 出 / 滚 入 (roll-out/roll-in) 技术 。 显 然 ， 
等 待 输入 /输出 操作 所 用 的 时 间 必 须 得 大 于 对 换 所 用 的 时 间 。 然 而 ， 利 用 内 存 直接 存 取 型 硬 
件 ， 一 个 连续 内 存 块 的 对 换 可 以 非常 迅捷 并 且 对 处 理 器 造成 的 开销 很 小 。 
10.4 ”固定 进程 数 的 多 进程 

然而 ， 即 使 是 对 换 技 术 也 是 不 够 的 ， 这 些 价格 不 菲 的 机 器 的 所 有 者 们 往往 想 让 这 些 机 
器 完成 更 多 的 事情 ， 以 便 能 够 对 得 起 他 们 所 投入 的 资金 。 为 此 ， 操 作 系 统 的 设计 人 员 开 始 寻 
找 更 好 的 组 织 相关 处 理 过 程 的 方法 。 由 于 主 存 继续 变 得 更 加 低廉 ， 所 以 有 关 设 计 人 员 开 始 想 
办 法 让 多 道 程序 同时 保留 在 主 存 中 ,在 它们 之 间 交 替 运行 多 个 程序 ， 而 且 不 用 将 它们 换 出 内 
存 一 一 毕竟 对 换 是 一 种 需要 耗费 大 量 资 源 的 操作 。 最 终 ， 他 们 认识 到 重 定位 寄存 器 可 以 支持 
运行 在 任何 位 置 的 一 道 程序 ， 而 不 仅仅 是 紧 靠 在 常 驻 操作 系统 顶部 的 程序 。 因 此 ， 他 们 转向 
考虑 如 图 10-6a 所 示 的 操作 系统 内 存 组 织 方案 。 当 初 ， 基 址 寄存 器 曾经 被 用 来 防止 应 用 程序 
对 操作 系统 的 危害 。 随 后 ， 这 类 寄存 器 的 使 用 被 改 成 了 重 定位 寄存 器 ， 主 要 用 来 解决 操作 系 
统 增长 的 问题 。 现 在 ， 当 操作 系统 运行 多 道 程序 并 且 一 道 程序 对 某 个 慢 速 设备 执行 输入 / 输 
出 操作 的 情况 下 ， 操 作 系 统 只 需 将 第 二 道 程 序 的 内 存 地 址 放 和 人 重 定位 寄存 器 中 便 可 开始 运行 
第 二 道 程序 。 这 种 情形 如 图 10-6b 所 示 。( 其 实 ， 操 作 系 统 所 做 的 事情 远 远 不 止 这 些 ， 但 在 
这 里 我 们 只 是 关注 内 存 方 面 的 一 些 管 理 操作 要 点 。) 








低 端 内 存 
a) 应 用 程序 1 运行 时 b) 应 用 程序 2 运行 时 


图 10-6 固定 进程 数 的 多 进程 操作 系统 示例 


此 刻 我 们 已 经 进展 到 : 还 有 其 他 的 应 用 程序 也 在 主 存 中 运行 ， 所 以 有 必要 针对 由 此 引 
发 的 新 问题 进行 研究 ， 以 使 相关 应 用 程序 不 会 彼此 危害 到 对 方 。 相 应 的 解决 方案 就 是 增加 一 
个 界限 寄存 器 (limit register)， 用 来 建立 一 个 上 限 (upper bound)， 如 果 超 出 这 一 上 限 ， 对 应 
程序 将 无 法 寻 址 ， 就 像 其 不 能 对 重 定位 寄存 器 所 设 定 的 程序 起 始 地 址 以 下 的 地 址 进行 访问 一 
样 。 有 人 可 能 会 认为 这 只 不 过 是 包含 程序 最 高 地 址 的 男 一 个 寄存 器 而 已 , 但 是 由 于 我 们 后 面 
将 要 说 明 的 有 关 原 因 ， 实 际 上 这 个 寄存 器 里 面 几乎 普遍 性 地 包含 的 是 对 应 程序 的 大 小 ， 而 不 
是 程序 的 最 高 地 址 。 有 关 硬 件 将 会 即时 地 把 这 一 界限 值 加 上 重 定位 地 址 值 ， 从 而 建立 起 当前 
程序 寻 址 的 上 限 。 与 下 限 (lower bound) 的 情形 一 样 ， 如 果 程 序 试图 访问 超出 由 界限 寄存 器 
所 设置 的 上 限 范围 的 内 存 ， 那 么 有 关 硬 件 将 会 产生 寻 址 错误 中 断 ， 进 而 操作 系统 将 会 中 止 对 
应 程序 。 因 此 ， 当 操作 系统 从 运行 这 道 程序 转向 运行 男 一 道 程序 时 ， 其 必须 同时 对 重 定位 寄 
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存 器 和 界限 寄存 器 进行 设置 。 


10.4.1 内 部 碎片 


当 安 装 这 种 类 型 的 操作 系统 时 ， 管 理 员 应 当 决 定 为 每 个 程序 区 域 或 内 存 分 区 ( partition) 
留 出 多 大 的 内 存 。 同 时 ， 在 系统 运行 的 过 程 中 ， 操 作 系统 不 应 更 改 这 些 内 存 分 区 的 大 小 。 对 
于 较 早 以 前 的 操作 系统 模型 来 说 ， 一 道 程序 可 能 不 会 使 用 所 有 的 内 存 。 而 如 果 有 关 程 序 没有 
用 完 所 有 内 存 ， 我 们 也 不 会 对 此 有 所 牵挂 。 现 在 ， 操 作 系 统 正 在 试图 把 更 多 的 程序 放 进 同一 
个 内 存 空间 里 。 如 果 我 们 为 每 个 内 存 分 区 留 出 100KB ， 而 我 们 想 要 运行 一 个 只 需要 6KB 的 
程序 ， 那 么 我 们 势必 会 浪费 掉 对 应 内 存 分 区 中 的 其 余 空间 。 这 部 分 未 被 使 用 的 空间 称 为 内 
部 碎片 〈internal fragmentation)， 如 图 10-7 所 示 。 我 们 可 能 会 设置 一 个 或 两 个 小 的 内 存 分 区 
用 来 运行 一 些 短小 精干 的 作业 ， 还 会 设置 一 个 或 两 
个 较 大 的 内 存 分 区 用 来 运行 我 们 的 大 型 的 应 用 程序 。 

这 样 将 有 利于 最 小 化 由 于 内 部 碎片 而 浪费 掉 的 内 存 内 部 碎片 
空间 。 如 果 管 理 员 可 以 更 加 精巧 地 设置 有 关内 存 分 

区 的 大 小 ， 那 么 正在 运行 的 程序 应 当 接近 于 填 满 主 ”起 内 
存 空间 ， 并 且 我 们 将 会 有 更 好 的 机 会 来 保持 昂贵 的 “的 顶部 
硬件 得 到 充分 的 利用 。 


10.4.2 ”分 时 共享 图 10-7 内 部 碎片 


利用 对 换 技术 的 男 一 种 情况 是 在 被 设计 为 以 所 谓 分 时 共享 ( time sharing， 或 简称 分 时 ) 
方式 来 支持 许多 用 户 通过 各 自 终端 使 用 的 系统 中 。 在 有 关 用 户 以 交互 方式 编辑 程序 并 测试 相 
应 程序 的 过 程 中 ， 其 中 绝 大 多 数 的 时 间 里 ， 有 关 进 程 是 在 等 待 对 应 终端 上 的 用 户 。 在 这 种 情 
况 下 ， 系 统 可 以 把 那些 对 应 用 户 正在 思考 或 执行 按键 操作 的 进程 换 出 内 存 。 在 第 10.3 节 所 
描述 的 例子 里 ， 只 有 一 个 内 存 分 区 ， 因 此 实际 上 只 会 有 一 个 进程 正在 执行 ， 任 何其 他 的 进程 
都 可 能 被 换 出 到 了 辅助 存储 器 。 在 分 时 共享 的 情况 下 ， 很 有 可 能 我 们 将 会 拥有 若干 内 存 分 
区 ， 或 许 甚至 是 许多 内 存 分 区 。 我 们 可 能 在 内 存 中 仅仅 保留 那些 当前 不 在 等 待 对 应 用 户 完 成 
一 行 输入 操作 的 进程 ， 这 些 进 程 或 者 正在 运行 ， 或 者 已 准备 就 绪 即 将 运行 ， 或 者 正在 等 待 除 
了 终端 输入 /输出 以 外 的 其 他 事情 。 训 无 疑问 ， 固 定 大 小 的 分 区 往往 会 浪费 内 存 空间 。 请 回 
想 一 下 我 们 刚刚 讨论 过 的 内 部 碎片 ， 在 那个 例子 里 ， 我 们 只 有 唯一 的 一 个 分 区 的 内 部 碎片 。 
而 现在 呢 ， 我 们 在 每 个 分 区 里 都 有 内 部 碎片 。 我 们 希望 能 够 利用 那些 碎片 。 如 果 我 们 节省 下 
了 足够 多 的 内 存 ， 那 么 也 许 我 们 就 能 够 运行 另 一 个 程序 从 而 保持 处 理 器 处 于 更 为 忙碌 的 状 
态 。 虽 然 这 些 技术 在 当时 已 经 足够 好 了 ， 但 是 对 于 现代 的 分 时 系统 来 说 ， 则 通常 会 使 用 下 一 
章 中 所 描述 的 技术 。 


10.5 可 变 进程 数 的 多 进程 

一 种 部 分 地 解决 了 这 种 内 部 碎片 问题 的 方案 是 使 内 存 分 区 的 大 小 或 数量 不 再 固定 不 变 。 
相应 地 ， 运 行 一 道 程序 需要 多 少 内 存 ， 我 们 使 用 多 少 内 存 。 因 此 ， 我 们 要 求 程序 设计 人 员 在 
运行 程序 之 前 能 够 估计 出 对 应 程序 所 需 主 存 的 最 大 数量 。 这 样 ， 当 我 们 启动 一 道 程序 时 ,我 
们 就 可 以 为 对 应 程序 分 配 刚好 那么 多 的 内 存 。 如 果 该 程序 试图 使 用 比 程序 员 所 声称 的 其 所 需 
主 存 最 大 数量 更 多 的 内 存 ， 那 么 操作 系统 将 会 按 发 生 了 错误 而 中 止 相 应 程序 。 在 一 道 程序 
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结束 时 ， 操 作 系 统 将 会 再 次 把 相应 内 存 区 域 置 为 空闲 可 用 状态 (或 “未 使 用 的 ”状态 )， 从 
而 使 其 可 用 来 运行 另 一 道 程序 。 这 部 分 内 存 空间 通常 被 称 为 空 穴 (hole)， 有 时 或 称 为 外 部 片 
段 (external fragment) 一 一 我 们 当前 根本 不 使 用 的 内 存 块 。 在 图 10-8a 中 ， 我 们 可 以 看 到 系 
统 当 前 正在 运行 四 道 应 用 程序 的 情形 。 在 图 10-8b 中 ， 我们 看 到 应 用 程序 2 和 应 用 程序 4 均 
已 经 结束 ， 因 此 它们 当初 运行 时 所 在 的 空 穴 现在 又 可 以 用 来 运行 其 他 的 程序 。 操 作 系统 通常 
需要 保存 一 张 可 用 的 空 穴 列表 。 在 图 10-8c 中 ， 我 们 看 到 操作 系统 已 经 启动 了 应 用 程序 5， 
而 其 占用 了 当初 应 用 程序 2 运行 时 所 在 的 空 穴 的 一 部 分 空间 ， 故 而 现在 形成 了 一 个 更 小 的 


空 六 。 





E 党 
a)4 道 作业 在 运行  b) 作 业 2 和 作业 4 均 已 结束 ”ce) 作 业 5 加 载 进入 一 个 空 穴 
图 10-8 可 变 进 程 数 的 多 进程 操作 系统 示例 


现在 假设 操作 系统 有 另外 一 个 程序 要 运行 ， 而 存在 很 多 空 穴 可 供 选 择 。 那 么 ， 操 作 系 
统 应 该 选择 哪个 空 穴 呢 ?与 我 们 在 本 书 中 研究 的 大 多 数 算法 类 一 样 ， 第 一 种 算法 就 是 直接 
扫描 整个 空 穴 列 表 ， 并 选用 其 间 我 们 所 发 现 的 第 一 个 足够 大 的 空 穴 来 运 行 相应 程序 。 这 种 
算法 称 为 首次 适应 ( first fit) 算法 ， 其 具有 简单 易 懂 上 且 易 实现 的 优点 ， 不 过 这 种 算法 可 能 
并 不 是 最 好 的 选择 。 另 一 种 算法 则 是 选用 可 以 容纳 我 们 想 要 运行 的 程序 的 最 小 的 空 穴 ， 该 
算法 称 为 最 佳 适应 ( best fit) 算法 。 从 直觉 上 来 说 ， 最 佳 适应 算法 非常 具有 吸引 力 一 一 那 
样 我 们 就 可 以 保证 浪费 的 主 存 最 小 呀 ! 然而 令 人 遗憾 的 是 ， 这 种 算法 要 求 我 们 或 者 扫描 整 
个 空 穴 列表 ， 或 者 按 空 穴 大 小 次 序 来 维护 该 空 穴 列表 ， 无 论 哪 一 种 方式 都 需要 额外 的 处 理 
开销 。 

如 果 我 们 的 一 般 的 程序 需要 10MB ， 而 我 们 有 一 个 程序 需要 8MB 来 启动 运行 ， 同 时 我 
们 现在 拥有 一 个 12MB 的 空 穴 和 一 个 18MB 的 空 穴 ， 那 么 我 们 应 该 怎么 办 呢 ? 如 果 我 们 使 
用 12MB 的 空 穴 ， 那 么 我 们 将 会 形成 和 留 下 一 个 4MB 的 空 穴 ， 一 般 来 说 这 样 大 小 的 空 穴 我 
们 是 无 法 再 使 用 的 。 而 如 果 我 们 使 用 18MB 空 穴 的 一 部 分 ， 那 么 我 们 将 会 形成 和 留 下 一 个 
10MB 的 空 穴 ， 一 般 来 说 这 样 大 小 的 空 穴 我 们 是 能 够 使 用 的 。 因 此 ， 接 下 来 的 这 种 算法 认 
为 ,我 们 应 当 使 用 最 坏 适 应 的 那个 空 灾 ， 理 由 在 于 该 算法 形成 和 留 下 了 最 大 (因而 是 最 有 用 
的 ) 的 空 穴 ， 称 之 为 最 坏 适 应 (worst fit) 算法 。 同 样 ， 这 种 算法 要 求 我 们 或 者 扫描 整个 空 穴 
列表 ， 或 者 按 空 穴 大 小 次 序 来 维护 该 空 穴 列表 。 

建立 在 首次 适应 算法 基础 上 并 有 一 些 轻微 改动 的 算法 称 为 循环 首次 适应 (next fit) 算法 。 
对 于 这 种 算法 来 说 ， 我 们 每 次 搜索 并 不 是 从 空 穴 列表 的 前 面 开 始 ， 并 且 我 们 不 用 保持 空 穴 
列表 的 有 序 性 。 准 确 地 说 ， 我 们 总 是 从 上 次 搜索 停 下 的 地 方 开 始 下 一 轮 的 搜索 。 首 次 适应 
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算法 往往 倾向 于 把 空 穴 列 表 前 面 的 那些 空 穴 分 解 地 七 零 八 落 ， 所 以 我 们 常常 会 形成 一 群 很 
小 的 空 穴 ， 这 些 空 穴 需要 我 们 不 断 地 浏览 审查 但 很 少 能 够 使 用 。 循 环 首次 适应 算法 则 倾向 
于 把 这 种 碎片 化 分 散 到 整个 空 穴 列表 的 各 个 地 方 。 在 实践 中 ， 最 坏 适 应 算法 被 证 实 是 效果 
最 差 的 ， 最 佳 适 应 算法 或 者 循环 首次 适应 算法 要 更 好 些 ， 并 且 循 环 首次 适应 算法 非常 容易 
实现 。 

现在 假设 我 们 拥有 两 个 分 别 为 SMB 的 空 穴 ， 并 且 我 们 有 一 个 声称 其 可 能 需要 8MB 来 
运行 的 进程 。 不 难看 出 ， 我 们 在 两 个 空 穴 中 共有 10MB 的 空闲 内 存 块 ， 二 者 合 到 一 起 有 足够 
的 空闲 内 存 支持 相应 进程 的 运行 。 但 是 ， 有 关 的 空闲 内 存 并 不 在 一 块 里 面 ， 所 以 我 们 无 法 运 
行 相应 程序 ， 这 种 情形 称 为 外 部 碎片 化 ( external fragmentation ) 。 请 注意 ， 我 们 的 进程 是 可 
重 定位 的 一 一 它们 可 以 在 物理 内 存 中 的 任何 位 置 运行 ， 因 为 相关 内 存 硬 件 是 在 有 关 进 程 运 行 
的 时 候 , 动态 地 实现 它们 的 逻辑 寻 址 空间 的 重新 定位 的 。 因 此 ， 在 内 存 中 移动 一 道 程序 是 可 
以 的 ， 即 使 是 在 有 关 程 序 已 经 开始 运行 的 前 提 条 件 下 。 通 常情 况 下 ， 有 关 进 程 应 被 挂 起 ,， 移 
动 到 另 一 个 位 置 ， 然 后 再 重新 启动 。 而 操作 系统 唯一 需要 做 的 就 是 ， 改 变 放置 在 重 定位 寄存 
器 中 的 数值 ， 使 其 指向 有 关 应 用 程序 在 物理 内 存 中 的 新 位 置 的 开始 地 址 。 例 如 ， 在 图 10-9a 
中 ， 如 果 有 两 个 空 穴 〈 标 记 为 “未 使 用 的 ”) 合 到 一 起 的 大 小 足够 支持 运行 应 用 程序 6， 那 么 
操作 系统 就 可 以 暂停 应 用 程序 3， 将 其 移动 到 紧 靠 应 用 程序 5 上 方 的 空间 区 域 ， 并 且 每 当 应 
用 程序 3 再 次 启动 执行 的 时 候 应 将 对 应 新 地 址 放 人 重 定位 寄存 器 中 。 这 样 ， 系 统 就 可 以 启动 
应 用 程序 6 运行 在 由 此 形成 的 较 大 的 空 穴 中 了 。 有 关 结 果 如 图 10-9b 所 示 。 这 一 过 程 称 为 紧 
凑 (compaction)。 自 然 地 ， 相 关 情 况 往往 比 这 个 简单 的 例子 要 复杂 得 多 ， 并 且 经 常 需要 几 
个 程序 同时 迁移 和 重新 定位 以 便 能 够 形成 和 找到 足够 大 的 空 穴 来 运 行 我 们 想 要 运行 的 那 道 程 
序 。 有 人 可 能 很 欣赏 ， 当 操作 系统 在 存储 器 中 移动 相关 程序 时 ， 期 间 没有 任何 操作 或 工作 是 
代表 那些 应 用 程序 而 完成 的 。 在 此 ,为 了 可 以 让 更 多 的 作业 能 够 并 行 运行 ， 操 作 系 统 选择 和 
付出 了 处 理 器 和 内 存 带 宽 。 





a) 对 于 应 用 程序 6 来 说 ， 虽然 b) 迁 移 和 重新 定位 应 用 
有 充足 的 内 存 空 间 但 有 关 程序 3 以 使 相应 的 两 个 
空 穴 却 不 是 连续 的 空 穴 合 并 到 一 起 


图 10-9 ”紧凑 


现在 ， 我 们 就 可 以 领会 为 什么 重 定位 硬件 是 用 长 度 而 不 是 用 程序 的 上 界 地 址 作为 上 限 的 
理由 了 。 如 果 有 关 硬 件 使 用 了 上 界 地 址 ， 那 么 当 我 们 重新 定位 一 道 程序 时 ， 我 们 还 必须 得 重 
新 计算 上 界 值 。 这 并 不 是 一 项 特别 复杂 的 计算 ， 并 且 也 不 需要 经 常 这 样 做 。 然 而 ， 如 果 有 关 
硬件 能 够 以 其 他 方式 很 好 地 工作 ， 那 么 我 们 很 庆幸 可 以 不 必 这 么 做 。 
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关于 紧凑 处 理 的 一 种 复杂 情况 可 能 是 ,输入 /输出 硬件 或 许 没有 使 用 有 关 重 定位 硬件 。 
换 句 话说 ,输入 /输出 操作 使 用 的 是 物理 地 址 而 不 是 逻辑 地 址 。 这 意味 着 ， 如 果 一 个 进程 有 
输入 /输出 操作 正在 进行 且 尚 未 完成 ， 那 么 我 们 就 不 能 在 内 存 中 对 其 进行 移动 。 因 此 ， 启 动 
了 输入 /输出 操作 的 进程 可 能 必须 临时 标记 为 不 可 移动 的 。 

我 们 还 可 能 依然 会 遭受 到 内 部 碎片 的 影响 ， 而 这 种 情况 的 发 生 则 源 自 于 我 们 的 空 穴 可 能 
会 变 得 越 来 越 小 的 现实 。 一 般 来 说 ， 让 操作 系统 来 监测 好 多 非常 小 的 内 存 块 经 常会 影响 到 系 
统 的 效率 。 因 此 ， 应 当 设 定 关于 操作 系统 试图 管理 的 某 种 最 小 内 存量 值 ， 通 常 这 一 最 小 量 值 
是 在 256B 到 4KB 之 间 的 范围 内 。 当 有 关 程 序 启动 时 ， 该 程序 将 被 分 配给 一 个 大 小 为 相应 最 
小 内 存量 值 ( 译 者 注 : 不 妨 称 大 小 为 相应 最 小 内 存量 值 的 内 存 为 单位 块 ) 的 整数 倍 的 内 存 块 。 
平均 而 言 ， 每 个 程序 将 不 需要 其 最 后 一 个 单位 块 的 一 半 大 小 的 空间 ， 所 以 这 部 分 内 存 将 会 被 
浪费 掉 一 一 可 变 进程 数 情 况 下 所 产生 的 内 部 碎片 。 


10.5.1 动态 加 载 


使 用 覆盖 技术 时 ， 我 们 没有 一 次 性 地 将 整个 程序 都 加 载 到 主 存 中 。 相 反 ， 程 序 设 计 人 员 
明确 指定 ， 什 么 时 候 加 载 有 关 的 覆盖 代码 区 域 ， 以 及 什么 时 候 调 用 覆盖 代码 区 域 中 的 相应 例 
程 。 系 统 应 当 也 可 以 做 类 似 的 事情 。 当 操作 系统 把 一 道 程序 加 载 到 主 存 中 时 ， 它 也 可 以 只 是 
把 程序 的 主体 部 分 加 载 到 了 内 存 中 。 而 为 了 访问 各 个 子 程序 ， 操 作 系统 可 能 会 设置 和 利用 一 
张 表 ， 其 中 标明 了 哪些 例 程 已 经 加 载 到 内 存 中 ， 哪 些 例 程 尚 未 加 载 到 内 存 。 许 多 程序 大 致 遵 
循 “80-20” 法 则 一 一 一 道 程序 中 80% 的 代码 是 为 了 应 对 那些 只 有 20% 的 时 间 才 会 发 生 的 情 
况 。 因 此 ， 如 果 我 们 在 程序 第 一 次 启动 时 不 加 载 有 关 的 子 程序 ,那么 我 们 可 能 永远 也 不 需要 
加 载 它们 。 这 样 ， 程 序 就 会 启动 得 更 快 些 。 而 如 果 程 序 稍 后 会 调用 有 关 例 程 ， 那 么 我 们 可 以 
在 那 时 候 再 加 载 对 应 例 程 ( 译 者 注 : 称 之 为 动态 加 载 )， 并 且 我 们 将 会 为 这 种 延缓 付出 很 小 
的 代价 一 一 一 小 部 分 的 内 存 用 于 保存 有 关 表 格 ， 同 时 每 当 我 们 第 一 次 调用 有 关 例 程 时 会 执行 
一 些 额 外 的 指令 。 


10.5.2 ”动态 链接 库 


然而 ， 我 们 甚至 可 以 把 绑 定 操作 也 向 后 推迟 一 步 。 也 就 是 说 ， 我 们 甚至 可 以 推迟 有 
关子 例 程 与 主 模块 之 间 的 链接 。 这 样 库 例 程 (library routine) 本 身 就 不 再 成 为 可 执行 程序 
的 组 成 部 分 。 相 反 ， 我 们 需要 原样 保留 编译 器 所 生成 的 针对 库 例 程 的 符号 引用 ( symbolic 
reference)。 于 是 ， 就 像 动 态 加 载 一 样 ， 如 果 有 关 例 程 从 未 真正 引用 过 ， 那 么 我 们 不 仅 不 会 
将 其 加 载 到 内 存 中 ， 而 且 我 们 甚至 没有 将 对 应 符号 绑 定 到 一 个 逻辑 地 址 上 。 这 里 ， 我 们 原样 
保留 的 这 些 子 例 程 是 在 通常 被 称 为 动态 链接 库 (Dynamic Link Libry，DLL) 的 特殊 的 库 中 。 
在 Linux 和 大 多 数 其 他 的 UNIX 变 体操 作 系统 中 ,这样 的 库 被 称 为 共享 对 象 库 或 动态 库 ， 并 
且 通 常 以 “.so” 作 为 其 名 称 的 一 部 分 。 当 引用 此 类 库 中 的 子 例 程 时 ， 操 作 系 统 将 会 在 程序 
执行 时 才 会 把 对 应 例 程 加 载 到 存储 器 中 并 绑 定 相应 链接 。 

注意 ， 我 们 还 同时 从 这 种 机 制 获 得 了 一 些 其 他 的 好 处 : 

e 由 于 有 关子 例 程 并 非 可 执行 程序 的 组 成 部 分 ， 所 以 相应 程序 比较 小 ， 故 而 就 只 会 占 

用 磁盘 驱动 器 上 的 更 少 的 空间 ， 并 可 以 更 快 地 加 载 到 内 存 中 。 
。 通常 情况 下 ， 我 们 将 会 拥有 使 用 相同 的 库 模块 的 许多 程序 。 其 中 的 某 些 库 模块 使 用 
的 频率 非常 高 ， 不 夸张 地 说 ， 它 们 将 会 被 硬盘 驱动 器 上 的 成 千 上 万 的 程序 所 引用 。 
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然而 此 时 ， 我 们 却 仅仅 需要 拥有 一 份 代码 副本 ， 由 此 便 可 以 为 我 们 节省 大 量 的 磁盘 
空间 。 

。 如 果 有 关 库 中 的 某 个 模块 的 错误 被 修复 ， 那 么 只 需要 修复 和 整理 相应 的 一 个 库 例 程 ， 

并 将 其 加 载 到 系统 上 。 这 将 会 实现 所 有 引用 相应 动态 链接 库 的 每 个 程序 中 的 对 应 错 
误 的 自动 修复 。 

对 于 应 用 程序 软件 的 开发 人 员 来 说 ， 上 面 的 最 后 一 项 特征 可 以 算得 上 是 一 份 巨大 的 因 
赐 ， 因 为 这 意味 着 ， 如 果 修 复工 作 是 由 操作 系统 制造 商 针对 系统 库 system library) 来 实施 ， 
那么 应 用 程序 开发 人 员 就 不 必 使 用 新 库 来 进行 应 用 程序 的 重新 组 装 和 生成 ， 也 无 须 将 可 执行 
程序 重新 分 发 给 正在 运行 对 应 平台 的 每 个 客户 。 而 如 果 有 客户 打 进 电话 来 ， 所 抱怨 的 是 与 另 
一 家 供应 商 所 提供 的 一 个 动态 链接 库 有 关系 ,应 用 程序 开发 人 员 也 只 是 需要 解释 一 下 ， 相 应 
问题 是 出 在 系统 库 中 ， 并 且 该 库 模块 在 版 本 x.y.z.1.5 中 就 已 经 进行 了 修复 ， 该 库 模块 可 以 从 
该 库 的 供应 商 的 网 站 下 载 ，……。 另 外 ， 如 果 应 用 程序 的 供应 商 真 的 特别 幸运 ， 有 可 能 客户 
是 先 在 其 他 的 某 个 应 用 程序 那里 发 现 的 此 类 问题 ， 并 在 该 客户 遭遇 到 他 们 的 应 用 程序 的 问题 
之 前 就 已 经 下 载 了 相关 已 完成 修复 处 理 的 新 库 。 , 

遗憾 的 是 ， 动 态 链接 库存 在 一 个 问题 。 具 体 来 说 ， 当 某 软件 包 的 开发 人 员 使 用 一 个 动 
态 链 接 库 中 的 一 组 特定 功能 时 ， 他 们 的 代码 也 可 能 依赖 对 应 库 的 特定 版 本 中 的 错误 修复 。 他 
们 应 当 希 望 确保 他 们 正在 使 用 的 这 组 功能 和 错误 修复 是 包含 在 安装 了 该 软件 包 的 任何 系统 上 
的 可 用 的 库 版 本 中 。 因 此 ， 软 件 包 安装 可 以 包括 一 个 库 版 本 至 少 是 与 该 软件 包 的 供应 商 开 发 
时 所 用 的 库 版 本 一 样 新 。 遗 憾 的 是 ， 目 标 系统 可 能 已 经 包含 了 由 另 一 个 软件 包 所 安装 的 更 高 
版 本 的 库 ， 该 软件 包 依赖 于 该 更 高 版 本 的 库 中 的 功能 或 错误 修复 。 安 装 较 旧 的 版 本 将 会 导致 
那个 已 安装 的 软件 包 出 现 故障 。 为 此 ， 突 然 出 现 故障 而 停止 工作 的 软件 包 的 供应 商 可 能 会 十 
分 惊讶 地 收 到 由 此 导致 的 支持 服务 请 求 ， 而 当 问 题 最 后 终于 得 到 解决 但 时 间 已 经 被 白白 浪费 
在 解决 一 个 与 他 们 公司 所 做 的 任何 事情 没有 哪怕 一 丁点 儿 关系 的 问题 上 的 时 候 ， 他 们 势必 会 
恼 盖 成 恩 ， 显 然 这 是 可 以 理解 的 。 当 然 ， 安 装 软件 应 该 检查 确认 正在 安装 的 任何 动态 链接 库 
要 比 已 经 安装 的 对 应 库 的 版 本 更 高 。 遗 憾 的 是 ， 这 项 检查 并 不 总 是 可 以 做 到 或 者 有 可 能 做 错 
了 ， 这 类 问题 俗称 为 动态 链接 库 地 狱 ( DLL Hell) 。 较 新 的 操作 系统 版 本 允许 应 用 程序 为 某 
个 动态 链接 库 指 定 版 本 号 ， 因 此 这 类 问题 就 通过 允许 一 个 系统 携带 单个 库 的 多 个 版 本 而 降低 
到 了 最 低 限度 。 这 样 一 来 ， 必 然 会 占用 一 些 额外 的 空间 ， 但 与 让 有 关 库 作为 每 个 使 用 该 库 的 
应 用 程序 的 一 部 分 所 消耗 的 空间 比较 起 来 ， 可 就 差 远 了 。 


10.6 ”小结 


在 本 章 中 ,我 们 讨论 了 关于 主 存 可 由 操作 系统 进行 管理 的 许多 方面 的 内 容 。 一 开始 ， 我 
们 讨论 了 为 什么 操作 系统 管理 内 存 ， 并 阐明 其 目的 是 为 了 支持 所 需 空间 大 于 机 器 主 存 空 间 大 
小 的 有 关 程 序 的 运行 ， 并 允许 尽 可 能 多 的 程序 一 起 运行 。 然 后 ， 我 们 讨论 了 软件 开发 周期 ， 
以 及 关于 地 址 绑 定 的 各 种 可 能 的 时 机 。 接 下 来 ， 我 们 渐进 式 地 探讨 了 更 为 复杂 的 内 存 模型 ， 
从 单个 进程 开始 ， 一 直到 涵盖 固定 的 和 可 变 的 多 进程 处 理 的 连续 内 存 组 织 方 式 。 有 关 讨 论 期 
间 ， 我 们 还 重点 说 明了 这 些 操作 系统 技术 所 需 的 硬件 支持 。 最 后 ， 我 们 还 用 一 节 内 容 介 绍 了 
有 关 例 程 的 动态 加 载 的 优点 和 不 足 。 

在 下 一 章 中 ， 我 们 将 会 讨论 通过 分 页 和 分 段 方式 来 解决 内 存 管 理 相关 问题 的 一 些 现代 的 
方法 。 
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操作 系统 必须 致力 于 管理 主 存 的 根本 原因 是 什么 ? 
从 程序 创建 开始 到 其 在 内 存 中 执行 所 需 经 历 的 5 个 步骤 是 什么 ? 


在 习题 10.2 中 所 列 出 的 5 个 步骤 之 中 ， 可 以 实施 绑 定 的 步 又 有 哪些 ? 


为 了 试图 同时 运行 多 道 作业 ， 我 们 创建 了 一 些 固定 分 区 。 在 此 我 们 遇 到 了 内 部 碎片 的 问题 。 请 描 


固定 分 区 的 一 种 替代 方案 是 允许 可 变 分 区 。 但 其 在 最 小 化 内 部 碎片 的 同时 ， 却 又 带 来 了 一 个 新 
的 问题 ， 即 外 部 碎片 的 问题 。 请 描述 这 个 问题 。 

关于 外 部 碎片 ， 我 们 采取 了 什么 措施 ? 

当 采 用 可 变 分 区 进行 内 存 管 理 时 ， 我 们 可 能 拥有 若干 空 穴 均 足够 大 到 可 以 运行 我 们 想 要 运行 的 
下 一 道 作业 。 我 们 列 出 了 4 种 算法 ， 用 来 从 足够 大 到 支持 对 应 进程 运行 的 那些 空 穴 中 选择 要 使 
用 的 空 从。 请 给 出 这 些 算法 的 名 字 并 加 以 简明 扼要 的 说 明 。 


10.10 “阐述 动态 加 载 和 动态 链接 之 间 的 区 别 。 和 
10.11 “动态 链接 拥有 一 个 巨大 的 优势 和 一 些 较 小 的 优势 。 请 阐明 这 个 巨大 的 优势 和 两 三 个 较 小 的 优势 。 ”[224 


第 11 章 | 


Operating Systems: A Spiral Approach 


高 级 的 内 存 管理 





这 一 章 将 继续 讨论 内 存 管 理 技术 。 特 别 地 ， 本 章 涵 盖 了 现代 系统 中 所 使 用 的 更 先进 的 技 
术 ， 即 高 级 的 内 存 管理 技术 。 第 11.1 节 讨论 了 上 一 章 相 关机 制 所 引发 的 有 关 问 题 以 及 为 什 
么 要 开发 新 技术 。 

第 11.2 节 描 述 了 有 关 分 页 硬件 的 功能 以 及 其 如 何 实现 逻辑 寻 址 空间 和 物理 寻 址 空间 的 
进一步 隔离 。 第 11.3 节 则 讨论 了 一 种 称 为 分 段 的 备 选 硬件 机 制 。 接 下 来 ， 第 11.4 节 介 绍 
了 如 何 把 分 页 和 分 段 结合 到 一 起 来 进行 使 用 。 在 第 11.5 节 中 ,我 们 转向 讨论 请 求 分 页 的 主 
题 一 一 只 有 当 相应 页 面 被 访问 时 才 将 它们 装 和 内存， 以 及 伴随 这 种 技术 而 出 现 的 一 些 问题 。 
第 11.6 节 介 绍 了 几 种 特殊 的 高 级 内 存 技术 ， 而 第 11.7 节 则 对 本 章 进 行 了 总 结 。 


11.1 为 什么 需要 硬件 的 辅助 支持 


采用 连续 内 存 分 配 的 多 进程 处 理 往往 会 导致 外 部 碎片 ， 于 是 有 些 时 候 ， 即 使 是 有 足够 的 
内 存 可 用 来 运行 有 关 程 序 ， 我 们 也 无 法 运行 它们 ， 这 种 情况 下 便 会 造成 内 存 和 处 理 器 资源 的 
浪费 。 在 上 一 章 中 ， 我 们 看 到 ， 尽 管 我 们 可 以 设法 缓解 这 个 问题 ， 但 是 相应 解决 方案 需要 运 
行 紧凑 例 程 ， 而 相关 处 理 过 程 则 是 对 处 理 器 和 内 存 的 非 生产 性 的 使 用 。 为 了 消除 这 个 问题 ， 
我 们 需要 进一步 对 程序 可 见 的 内 存 地 址 空间 (逻辑 地 址 ) 和 硬件 所 使 用 的 地 址 空间 (物理 地 
址 ) 进行 隔离 ， 从 而 使 一 道 程序 的 各 个 组 成 部 分 不 一 定 非得 装 在 一 片 连续 的 内 存 空 间 中 。 要 
实施 这 项 隔离 需要 硬件 的 辅助 支持 。 有 关 问 题 可 以 采用 若干 种 不 同 的 方法 ， 而 这 些 方法 将 在 
以 下 各 节 中 分 别 展开 介绍 。 


11.2: 分 页 


早 些 时 候 ， 我 们 讨论 了 把 逻辑 寻 址 空间 与 物理 寻 址 空间 区 别 开 来 的 想法 。 我 们 改造 了 有 
关内 存 管理 部 件 ( Memory Management Unit，MMU ) 以 使 其 支持 这 种 想法 。 进 而 ， 我 们 不 
再 使 用 基 址 寄存 器 来 进行 地 址 的 检查 ， 而 是 使 用 它 来 重 定位 地 址 。 这 便 允 许 我 们 把 任何 程序 
放置 在 内 存 的 任何 地 方 一 一 动态 重 定位 ( dynamic relocation ) 。 然 而 我 们 发 现 ， 人 允许 可 变 大 
小 的 程序 在 内 存 中 进 进 出 出 将 会 导致 我 们 拥有 内 存 的 外 部 碎片 ， 并 需要 花费 宝贵 的 处 理 器 时 
间 来 实施 紧凑 处 理 。 遗 憾 的 是 ， 从 紧凑 并 非 用 户 试 图 要 做 的 任何 事情 这 个 意义 上 来 讲 ， 它 还 
算 不 上 什么 “有 用 的 工作 ”。 它 仅仅 是 操作 系统 谋划 使 相关 事物 在 整体 意义 上 更 好 地 运作 的 
一 项 任务 而 已 。 于 是 ， 最 后 终于 又 开发 出 了 另外 一 种 解决 方案 一 一 我 们 把 内 存 划分 成 固定 大 
小 的 物理 块 ， 从 而 不 再 把 一 个 应 用 程序 所 需 的 在 一 个 大 的 分 段 中 的 整个 空间 都 分 配给 它 ， 而 
是 分 配 足够 多 的 较 小 的 物理 块 给 程序 以 满足 它 的 需要 。 鉴 于 我 们 要 求 有 关内 存 管理 部 件 分 
别 独立 地 针对 每 个 物理 块 进行 动态 的 重 定位 ， 所 以 我 们 分 配 的 这 些 物理 块 并 不 需要 是 连续 
的 它们 可 以 在 内 存 中 的 任何 地 方 。 这 种 技术 被 称 为 分 页 (paging)。 同 时 ， 这 也 意味 着 我 
们 不 得 不 让 我 们 的 内 存 管理 部 件 变 得 更 加 复杂 。 

我 们 将 会 把 我 们 的 物理 地 址 空间 划分 为 统一 大 小 的 物理 块 ， 称 之 为 页 框 ( frame， 或 称 
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为 物理 块 ， 有 时 也 称 为 内 存 页 面 ， 甚 至 简单 地 称 为 页 面 )。 与 此 同时 ,我 们 从 概念 上 将 逻辑 
寻 址 空间 划分 成 一 系列 同样 是 统一 大 小 的 称 为 页 面 (page， 或 称 为 分 页 ) 的 块 ， 且 页 面 的 大 
小 与 页 框 相同 。 通 常 ， 这 些 块 的 大 小 是 512B 到 8SKB。 对 于 按 字 节 寻 址 的 机 器 来 说 ， 一 个 块 
中 的 字 节 数 一 般 总 是 2 的 整 次 老 。 今 天 ， 一 种 常见 的 页 面 大 小 为 4KB， 不 过 ， 随 着 内 存 和 
硬盘 驱动 器 的 空间 的 增 大 ， 将 意味 着 未 来 我 们 很 可 能 会 看 到 更 大 的 页 面 大 小 。 图 11-1 就 每 
个 地 址 引用 的 重 定位 过 程 进行 了 展示 。 





图 11-1 基于 分 页 的 内 存 访问 


在 图 中 ,我 们 看 到 处 理 器 生成 一 个 内 存 地 址 。 一 般 来 说 ， 程 序 忽 略 了 内 存 以 单独 的 页 面 
来 进行 管理 的 事实 ， 因 此 ， 这 些 地 址 仅仅 被 认为 是 逻辑 地 址 空间 范围 内 的 一 个 二 进 制 数 。 有 
关 地 址 可 能 是 ( 按 次 序 而 言 的 ) 下 一 条 指令 的 地 址 、 要 跳 转 执行 的 子 程序 的 地 址 或 者 是 对 数 
据 项 或 堆栈 的 引用 的 地 址 。 在 这 里 ， 有 关 地 址 引用 的 目的 并 不 重要 。 就 像 前 面 一 样 ， 我们 把 
这 一 地 址 称 为 逻辑 地 址 。 然 而 ， 内 存 管理 部 件 将 把 该 地 址 看 作 是 由 两 部 分 组 成 的 ， 这 里 分 别 
标记 为 页 号 (page number) p 和 偏 移 地 址 ( displacement) d。 此 偏 移 地 址 是 页 框 内 特定 字 节 
的 地 址 。 如 果 我 们 的 页 框 的 大 小 是 4KkB， 那 么 我 们 的 偏 移 地 址 字段 长 度 就 应 是 寻 址 一 个 页 
框 内 的 每 个 字 节 所 需 的 合适 的 大 小 ， 也 就 是 12 个 二 进 制 位 。 当 我 们 将 逻辑 地 址 重新 定位 到 
一 个 物理 地 址 时 ， 我 们 在 对 应 页 框 中 所 寻 址 的 偏 移 地 址 与 我 们 在 相应 页 面 中 所 寻 址 的 偏 移 地 
址 是 相同 的 。 为 此 ， 我 们 无 须 改变 逻辑 地 址 的 偏 移 地 址 部 分 。 逻 辑 地 址 的 剩余 部 分 是 页 号 。 
我 们 需要 重 定位 的 就 是 页 面 ， 因 此 我 们 应 当 查 找 关 于 重 定位 地 址 的 一 个 页 表 ( page table) 以 
确定 相应 的 页 框 。 我 们 将 会 拥有 一 个 寄存 器 用 来 保存 当前 正在 运行 的 进程 的 页 表 的 内 存 地 
址 ， 该 寄存 器 称 为 页 表 地 址 寄存 器 ( page table address register)。 有 关内 存 控制 部 件 将 会 根 
据 在 处 理 器 中 运行 的 进程 所 产生 的 逻辑 地 址 中 的 页 号 以 及 页 表 地 址 寄存 器 中 的 数值 执行 加 法 
操作 ， 从 而 查找 和 定位 到 相应 的 页 表 项 上 。 存 储 在 页 表 的 该 位 置 的 数值 就 是 我 们 正在 试图 访 
问 的 特定 页 框 的 重 定位 地 址 。 在 这 个 例子 里 ， 它 显示 为 数值 fs 数值 f 应 当 与 我 们 已 经 拥有 
的 用 来 寻 址 物理 内 存 中 特定 字 节 的 偏 移 地 址 组 合 到 一 起 ， 从 而 生成 相应 的 完整 的 物理 地 址 。 

图 11-2 显示 了 一 张 更 为 完整 的 页 表 。 我 们 忽略 了 地 址 的 偏 移 地 址 部 分 ， 而 只 考虑 页 面 
是 如 何 映射 到 页 框 的 。 我 们 看 到 ， 当 前 正在 运行 的 进程 的 逻辑 地 址 空间 被 划分 成 了 分 别 标记 
为 A 一 互 的 若干 页 面 ， 例 如 ， 第 三 个 页 面 被 标记 为 C。 如 果 处 理 器 生成 了 一 个 针对 此 页 的 引 
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用 ,那么 内 存 管 理 部 件 将 通过 查看 该 进程 的 页 表 中 的 第 三 项 来 进行 这 一 地 址 的 转换 。 这 里 ， 
我 们 看 到 该 项 中 包含 的 页 框 号 为 7。 因 此， 内 存 管理 部 件 将 具体 查看 页 框 7 来 寻找 我 们 正在 
访问 的 信息 。 当 然 ， 在 实际 的 系统 中 ， 一 个 进程 的 页 框 将 被 分 散 开 来 并 与 来 自 其 他 进程 的 页 
框 混杂 到 一 起 。 





图 11-2 ”逻辑 地 址 到 物理 地 址 的 映射 


11.2.1 要 求 两 次 访问 内 存 

上 面 我 们 已 经 对 这 种 机 制 进行 了 描述 ， 然 而 ， 其 中 存在 一 个 问题 。 也 就 是 说 ， 就 针对 
内 存 的 每 次 引用 来 说 ， 我 们 必须 得 对 内 存 进行 另外 一 次 的 引用 以 便 找到 作为 该 页 面 的 重 定位 
因子 的 相应 页 表 项 。 简 言 之 ， 内 存 的 每 次 引用 均 要 求 两 次 访问 内 存 。 这 样 将 会 使 我 们 的 进程 
在 访问 内 存 时 是 以 半 速 运行 ， 这 显然 是 不 可 接受 的 代价 。 与 计算 机 系统 中 的 许多 其 他 事情 
一 样 ， 我们 的 解决 方案 是 让 内 存 管理 部 件 缓存 最 近 的 几 个 重 定位 因子 ， 从 而 使 我 们 不 必 非 
得 到 内 存 中 查找 它们 就 可 以 再 次 使 用 它们 。 这 种 缓存 是 通过 称 为 快 表 ( translation lookaside 
buffer，TLB ， 又 称 为 转换 后 援 缓冲 器 ) 的 一 种 特殊 类 型 的 硬件 设备 来 完成 的 。 快 表 是 一 种 
叫 过 若干 个 名 称 的 电路 ， 有 时 被 称 为 内 容 可 寻 址 存储 器 ( Content Addressable Memory,，CAM) 
或 关联 存储 器 ( associative memory， 又 称 为 联想 存储 器 ) 。 这 个 电路 元 件 的 精华 是 ， 当 它 试 
图 检查 确认 自己 是 否 包 含 某 个 页 号 时 ， 其 所 有 表 项 的 搜索 是 并 行 展开 的 。 这 意味 着 ， 快 表 中 
的 表 项 不 必 非 得 以 某 种 顺序 来 保存 ， 因 为 它们 都 是 在 同一 时 间 进 行 比 较 的 。 如 果 我 们 试图 
访问 的 页 面 最 近 曾 被 访问 过 ， 那 么 它 应 当 包含 在 快 表 中 ， 故 而 相关 查找 结果 将 会 被 很 快 返 
回 一 一 也 许 比 我 们 访问 主 存 中 的 页 表 要 快 上 100 倍 。 显 然 ， 快 表 是 一 个 复杂 的 电路 。 因 此 ， 
它们 的 容量 通常 相当 小 。 在 目前 的 机 器 上 ， 它 们 一 般 很 少 会 超过 1000 个 表 项 ， 而 且 常 常会 
更 少 。 然 而 在 通常 情况 下 ， 这 足以 使 大 多 数 的 进程 在 大 部 分 的 时 间 里 都 可 以 在 该 缓存 中 找到 
所 需 的 信息 。 快 表 的 使 用 机 制 如 图 11-3 所 示 。 


11.2.2 ”有 效 的 内 存 访问 时 间 


有 一 个 公式 ,我 们 可 以 用 来 评估 有 关 快 表 对 计算 机 执行 速度 的 影响 。 根 据 该 公式 ， 我 们 
将 会 计算 有 效 访问 时 间 (Effective Access Time, EAT)。 该 公式 中 用 到 了 快 表 查 找 的 速度 (我 
们 记 为 E)、 主 存 引用 的 速度 (我 们 记 为 M) 以 及 关于 我 们 在 快 表 中 能 够 找到 我 们 所 引用 的 
页 号 的 情形 在 所 有 时 间 内 所 占 的 百分比 (我 们 记 为 A)。 这 个 百分比 通常 被 称 为 命中 率 (hit 
ratio)。 不 言 而 喻 ,我 们 在 快 表 中 找 不 到 所 引用 页 面 的 百分比 ( 即 快 表 的 未 命中 率 ) 应 当 是 
1-A。 举 例 来 说 ， 如 果 我 们 在 所 有 时 间 里 可 以 命中 80%， 那 么 我 们 在 所 有 时 间 里 将 会 错失 
20%， 即 未 命中 率 为 20%。 当 我 们 在 快 表 中 找到 对 应 页 号 的 情况 下 ， 那 么 内 存 引 用 过 程 耗费 
的 时 间 将 会 是 E+M， 其 中 搜索 快 表 的 时 间 为 E， 而 用 来 进行 正常 的 内 存 引 用 的 时 间 为 M。 当 
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页 表 , 几 ， 
(在 内 存 中 ) | | 
出国 

Ms 

Lg 
图 11-3” 快 表 机 制 


我 们 在 快 表 中 找 不 到 对 应 页 号 的 情况 下 ,那么 总 的 内 存 引 用 时 间 应 当 是 2*M， 即 两 次 内 存 
引用 的 时 间 ， 其 中 一 次 用 于 从 页 表 中 获取 相应 的 页 框 号 ， 另 一 次 用 于 正常 的 内 存 引用 。 为 
此 ， 综 合 而 言 ， 有 效 的 内 存 访问 时 间 应 当 是 : 

EAT=A(E+M)+(1-A)(2*M) 

例如 ， 设 定 我 们 的 快 表 查找 时 间 (E) 为 Sns， 而 我 们 的 内 存 访问 时 间 (M) 为 100ns， 
且 我 们 的 命中 率 (A) 为 80%。 那 么 ， 有 效 的 内 存 访问 时 间 就 应 当 是 0.8(100+5)+(1-0.8)* 
(2*100)， 也 就 是 124ns。 同 正常 的 内 存 引 用 相 比 ， 这 里 有 约 25% 的 降 速 。 

根据 有 关 硬 件 设计 ， 快 表 查 找 可 能 是 发 生 在 第 一 次 内 存 引 用 被 触发 的 同时 。 如 果 快 表 查 
找 不 成 功 ， 那 么 主 存 的 引用 将 会 继续 。 在 这 种 情况 下 ， 刚 才 给 定 的 公式 才 是 适用 的 。 但 是 ， 
某 些 其 他 的 硬件 可 能 是 直到 快 表 查 找 失败 时 才 启 动 第 一 次 内 存 引 用 。 在 这 种 情况 下 ， 有 效 的 
内 存 访问 时 间 公 式 应 当 是 : 

EAT=A(E+M)+(1-A)(E+2*M) 

一 般 来 说 ， 我 们 的 快 表 越 大 ， 其 命中 率 就 越 高 。 例 如 ， 使 用 与 上 面 的 例子 相同 的 基础 数 
据 但 命中 率 修正 为 900%， 那 么 有 效 的 内 存 访 问 时 间 应 当 是 0.9(100+5)+(1-0.9)*(2*100)， 也 
就 是 114.5ns。 同 正常 的 内 存 引 用 相 比 ， 这 里 仅仅 只 有 不 到 15% 的 降 速 。 遗 憾 的 是 ， 这 是 一 
个 硬件 设计 决策 ， 而 不 是 一 个 软件 问题 或 者 甚至 系统 的 购买 者 可 以 做 出 的 决定 。 还 有 ， 快 表 
与 内 存 不 同 。 具 体 而 言 ， 快 表 一 般 不 是 可 升级 的 ， 快 表 是 内 存 管 理 部 件 本 身 不 可 分 割 的 一 部 
分 并 且 通 常 答 人 在 处 理 器 芯片 中 。 

请 注意 ， 每 个 进程 拥有 相同 的 逻辑 寻 址 空间 一 一 相应 地 址 从 0 开始 ， 并 向 上 递增 ， 一 
直到 地 址 取 值 为 程序 大 小 。 在 大 多 数 系统 上 ， 快 表 硬 件 并 不 关心 是 哪个 进程 正在 运行 。 当 一 
个 进程 运行 时 ， 快 表 将 填充 与 当前 运行 进程 的 页 号 相对 应 的 页 框 号 。 当 我 们 切换 到 男 一 个 进 
程 时 ， 操 作 系 统 必须 告知 硬件 忘掉 所 有 当前 的 页 框 号 ， 因 为 新 的 进程 将 会 拥有 不 同 的 页 框 号 
需要 映射 到 前 一 个 进程 曾经 使 用 过 的 相同 页 号 上 。 因 此 ， 在 我 们 执行 上 下 文 切换 到 新 的 进程 
后 ， 对 于 一 开始 发 生 的 几 个 内 存 引 用 ， 我 们 往往 不 会 在 快 表 里 命中 ， 所 以 我 们 的 进程 将 会 以 
半 速 来 执行 有 关 的 内 存 引 用 指令 。 这 也 是 为 什么 我 们 不 想 频 繁 地 切换 进程 以 及 为 什么 切换 
线程 比 切 换 进 程 更 快 的 一 个 原因 所 在 。 一 些 硬件 设计 确实 提供 了 地 址 空间 标识 符 ( Address 
Space Identifier，ASID), 将 其 与 相应 的 页 框 号 一 起 存放 在 缓存 中 ， 而 且 相 关 设 计 不 再 要 求 
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刷新 快 表 (进程 切换 时 )。 但 是 ， 它 们 仍然 会 发 生 许 多 的 快 表 未 被 命中 的 情况 ， 故 而 会 在 一 
个 较 短 的 时 间 内 以 较 慢 的 速度 运行 ， 直 到 快 表 被 重新 填充 。 对 于 支持 多 个 进程 以 并 行 方式 运 
行 的 处 理 器 来 说 ， 这 种 类 型 的 快 表 非常 有 用 。 


11.2.3 ”内 存 访问 控制 


当 我 们 使 用 一 个 重 定位 寄存 器 来 访问 整个 程序 的 主 存 时 ， 我 们 还 拥有 一 个 界限 寄存 融 
用 来 禁止 一 个 进程 访问 那些 分 配给 它 的 内 存 区 域 以 外 的 空间 。 采 用 分 页 硬件 的 情况 下 ， 我 
们 也 将 需要 一 种 类 似 的 机 制 。 对 于 各 个 页 面 本 身 而 言 ， 并 没有 什么 问题 ， 因 为 它们 通常 都 
具有 固定 的 大 小 。 然 而 ， 我 们 将 会 需要 某 种 机 制 用 来 限制 对 页 表 的 访问 。 这 一 问题 基本 上 
存在 两 种 解决 方法 ， 且 这 两 种 方法 都 依赖 于 相应 的 硬件 ， 所 以 不 是 由 操作 系统 的 设计 人 员 所 
决定 的 ， 不 过 ， 我 们 还 是 会 讨论 相关 方法 ， 以 便 你 能 够 对 此 有 所 了 解 。 第 一 种 方法 是 使 用 固 
定 的 页 表 大 小 。 在 这 种 情况 下 ， 我 们 需要 利用 每 个 页 表 字 中 的 一 个 有 效 〈 valid) 位 来 指示 对 
应 页 表 地 址 是 否 有 效 。 例 如 ， 如 果 我 们 拥有 一 个 固定 大 小 为 10 个 表 项 的 页 表 并 且 该 进程 在 
逻辑 地 址 空间 中 仅 占 用 了 三 个 页 面 ， 那 么 我 们 将 用 对 应 的 内 存 页 面 编号 ( 即 页 框 号 ) 地 址 来 
填充 前 三 个 页 表 项 ， 同 时 把 这 三 个 页 表 项 的 有 效 位 设置 为 “有 效 ”( 璧 如 具体 表示 为 二 进 制 位 
“1”)。 而 对 于 该 页 表 中 的 其 余 表 项 ， 由 于 它们 并 没有 包含 对 有 效 页 面 的 引用 ， 所 以 我 们 将 
其 相应 的 有 效 位 设置 为 “无 效 ”( 璧 如 具体 表示 为 二 进 制 位 “0”)。 当 内 存 管 理 部 件 访问 页 表 
中 的 任何 表 项 时 ， 如 果 对 应 表 项 的 有 效 位 是 设置 为 “无 效 "， 那 么 它 将 会 产生 一 个 内 存 寻 址 
错误 。 

内 存 地 址 控制 的 另 一 种 方法 是 使 用 具有 可 变 大 小 的 页 表 。 在 这 种 情况 下 ， 我 们 将 会 拥 
有 一 个 页 表 长 度 寄存 器 ( page table length register) 。 对 于 单个 的 重 定位 寄存 器 而 言 ， 我 们 所 
拥有 的 长 度 寄存 器 用 来 说 明 主 存 中 的 进程 的 长 度 。 而 页 表 长 度 寄存 器 的 作用 则 像 它 字面 上 的 
意思 一 样 ， 具 体 用 来 保存 一 个 进程 的 最 大 有 效 页 号 。 如 果 处 理 器 在 进程 运行 时 所 生成 的 地 址 
包含 了 一 个 比 页 表 长 度 寄存 器 中 的 数值 还 要 大 的 页 号 ,那么 有 关 硬 件 将 产生 一 个 寻 址 错误 中 
断 ， 因 为 该 进程 生成 了 一 个 针对 该 进程 逻辑 地 址 空间 以 外 的 页 面 的 引用 。 现 在 ， 大 多 数 系统 
都 采用 有 效 位 方案 ,相关 理由 我 们 将 会 在 后 面 看 到 。 

页 面 访问 保护 

除了 限制 内 存 寻 址 之 外 ， 分 页 机 制 还 允许 操作 系统 限制 针对 各 种 页 面 可 以 采取 的 访问 
方式 。 例 如 ， 有 关 硬 件 可 以 被 设置 为 仅 允 许 对 一 个 页 面 进行 读 取 访 问 ， 或 者 仅 允 许 执行 访 
问 。 为 了 有 效 地 利用 这 一 机 制 ,编译 器 (和 汇编 器 ) 必须 能 够 强制 对 应 的 链接 器 按 页 面 范围 
来 放置 可 执行 文件 的 各 个 部 分 。 这 样 ， 对 应 模块 的 数据 部 分 就 可 以 被 标记 为 允许 读 写 但 不 
可 执行 。 类 似 地 ， 程 序 代 码 可 以 被 标记 为 仅 允 许 执 行 。 不 过 ， 这 种 机 制 还 存在 一 些 问 题 需 
要 解决 。 例 如 ， 就 堆栈 而 言 ， 似 乎 看 起 来 不 应 当 赋予 堆栈 上 的 项 以 执行 访问 方式 。 但 是 对 于 
Java 虚拟 机 来 说 ， 把 Java 程序 字 节 码 编译 为 堆栈 中 的 指令 并 在 那里 执行 它们 则 是 经 常会 有 
的 事情 。 


11.2.4 ”大 页 表 


在 具有 现代 操作 系统 和 现代 编译 器 的 现代 机 器 中 ， 程 序 正 变 得 非常 庞大 。 这 意味 着 页 表 
也 非常 大 。 此 外 ， 事 实证 明 ， 在 许多 情况 下 页 表 是 稀疏 的 ， 故 而 意味 着 位 于 逻辑 地 址 空间 范 
围 内 的 有 关 页 表 项 大 部 分 并 没有 指向 一 个 有 效 的 页 框 。 稍 后 ， 我 们 将 讨论 会 发 生 这 种 情况 的 
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一 些 原因 。 无 论 如 何 ， 就 分 配给 页 表 自 身 的 内 存 进 行 管理 这 一 任务 来 说 ， 已 变 得 越 来 越 难 。 
不 过 ， 还 是 有 若干 种 不 同 的 方法 可 用 来 处 理 这 些 大 而 稀疏 的 页 表 。 

第 一 种 技术 是 构建 多 级 页 表 ( multilevel page table)。 图 11-4 显示 了 一 个 两 级 页 表 一 一 
其 本 质 就 是 对 页 表 又 进行 了 分 页 。 与 我 们 已 经 讨论 的 单 级 页 表 一 样 ， 内 存 管理 部 件 把 由 处 理 
器 产生 的 逻辑 地 址 看 作 是 由 若干 部 分 组 成 的 一 一 在 这 个 示例 中 ， 即 由 三 部 分 组 成 。 和 前 面 一 
样 ， 我 们 拥有 对 应 的 页 面 内 部 的 偏 移 地 址 ， 它 将 会 被 直接 带 和 后续 转 换 环 节 并 用 作 相 应 的 页 
框 内 部 的 偏 移 地 址 。 现 在 ,我们 进一步 将 页 面 编 号 看 作 是 由 两 部 分 组 成 的 ， 图 中 具体 标记 为 
pl 和 p2。 其 中 ，pl 将 被 有 关 硬 件 用 来 访问 顶级 页 表 (也 称 为 一 级 页 表 )， 就 像 前 面 所 描述 的 
那样 。 然 而 ， 存 储 在 顶级 页 表 的 表 项 中 的 数值 并 不 是 我 们 最 终 真正 要 访问 的 内 存 地 址 所 对 应 
的 页 框 号 ， 而 是 对 应 于 一 个 二 级 页 表 的 内 存 地 址 。 页 号 的 剩余 各 位 (这 里 标记 为 p2 ) 将 用 来 
在 所 选择 的 二 级 页 表 内 进行 访问 ， 且 二 级 页 表 的 表 项 将 会 给 出 在 原始 地 址 中 由 pl 和 p2 所 表 
示 的 页 号 相对 应 的 页 框 号 。 该 页 框 号 将 与 原始 的 偏 移 地 址 一 起 使 用 ， 用 来 访问 物理 存储 器 中 
的 相应 请 求 的 内 存 位 置 。 数 字 设 备 公司 (Digital Equipment Corporation，DEC) 的 VAX 系 
统 就 曾 使 用 了 两 级 分 页 体系 结构 。 





图 11-4 两 级 页 表 


两 级 页 表 被 证 明 是 一 种 非常 有 用 的 技术 并 且 还 得 到 了 扩展 利用 。 现 代 处 理 器 通常 支持 三 
级 或 四 级 页 表 架 构 。 请 注意 ， 这 可 能 会 潜在 地 导致 我 们 的 有 效 的 内 存 访问 时 间 发 生变 化 。 对 
于 四 级 页 表 来 说 ， 在 最 坏 的 情况 下 ， 我 们 可 能 要 进行 $ 次 内 存 访问 才能 访问 到 内 存 中 的 真正 
的 所 请 求 访问 的 那个 字 节 ， 因 为 可 能 每 个 页 表 引 用 都 不 在 快 表 中 。 故 而 ， 我 们 的 有 效 的 内 存 
访问 时 间 公式 就 应 修正 为 如 下 的 样子 : 

EAT=A(E+M)+(1_A)(S*M) 
幸运 的 是 ， 在 大 多 数 时 候 ， 我 们 的 快 表 将 会 持 有 那些 最 后 的 物理 内 存 引用 。 所 以 总 的 来 说 ， 
我 们 只 是 比 单 级 页 表 需 要 承受 稍 大 一 点 的 性 能 损失 。 

值得 注意 的 是 ， 这 项 技术 具有 创建 虚拟 页 表 ( virtual page table) 的 功效 。 由 于 地 址 空间 
是 如 此 庞大 ， 所 以 页 表 通 常情 况 下 非常 稀 下 一 一 其 中 有 好 大 部 分 的 地 址 空间 并 没有 被 真正 用 
到 。 在 这 样 的 情况 下 ， 那 些 较 低 级 别 的 页 表 的 相应 部 分 在 其 被 实际 使 用 之 前 ， 并 不 需要 分 配 
内 存 和 进行 填充 ， 从 而 可 以 节省 大 量 的 表 空 间 以 及 相关 访问 所 必需 的 资源 。 
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11.2.5 “ 反 置 页 表 


针对 页 表 大 而 稀 玻 问题 的 另 一 种 略 有 不 同 的 方法 是 把 问题 转化 一 下 ， 即 把 物理 页 框 映 
射 到 逻辑 页 面 中 。 图 11-5 显示 了 一 种 处 理 页 面 映射 的 所 谓 反 置 页 表 ( inverted page table ) 方 
法 。 反 置 页 表 按 物理 页 框 号 顺序 保存 ， 且 该 表 本 身 将 被 搜索 以 查找 相应 的 引用 。 鉴 于 整个 系 
统 只 有 一 张 这 样 的 表 ， 所 以 仅仅 提供 来 自 各 个 进程 的 页 号 并 不 足以 指定 对 应 的 映射 。 例 如 ， 
每 个 进程 都 应 拥有 页 号 0。 因 此 ， 进 程 标 识 符 必 须 与 页 号 一 起 存放 在 反 置 页 表 中 。 搜 索 反 置 
页 表 往 往 要 比 搜索 普 通 的 页 表 慢 些 。 一 般 而 言 ， 操 作 系 统 可 以 通过 使 用 散 列 函数 (也 称 为 哈 
希 函 数 ) 来 访问 该 表 以 提高 相应 搜索 速度 。 由 于 有 些 进 程 可 能 拥有 散 列 到 相同 数值 的 页 号 / 
进程 标识 符 组 合 ， 所 以 相关 方法 还 需要 通过 一 种 链接 方案 来 解决 冲突 。 因 此 ， 反 置 页 表 甚 至 
相 比 于 普通 的 页 表 ， 使 我 们 更 加 依赖 于 通过 快 表 查找 来 完成 我 们 的 大 多 数 查找 。 尽 管 如 此 ， 
反 置 页 表 确 实 比 普通 页 表 使 用 的 内 存 要 少 得 多 。 





图 11-5 反 置 页 表 


11.2.6 ”支持 页 面 大 小 多 样 化 的 页 表 


在 后 来 的 系统 中 已 经 普遍 支持 两 种 以 上 的 页 表 大 小 。 例 如 ， 在 英特尔 奔腾 处 理 器 体系 
结构 中 ， 普 通 的 页 面 大 小 为 4096 B， 但 是 同时 还 存在 另 一 种 可 能 的 页 面 大 小 为 4MB。 这 样 
做 的 理由 是 为 了 使 操作 系统 的 内 核 可 以 在 进程 的 页 表 中 进行 映射 ， 但 不 会 让 页 表 为 此 占用 太 
多 的 内 存 。 大 多 数 的 内 核 页 面 在 每 个 进程 中 都 是 相同 的 ， 并 且 它 们 从 不 移 来 移 去 ， 也 不 会 导 
致 碎片 ， 而 且 它 们 始终 保持 在 相同 的 位 置 ， 因 此 不 需要 让 它们 跟 具 有 未 知 大 小 和 未 知 持续 时 
间 的 进程 一 样 ， 也 分 解 成 小 的 页 面 。 此 外 ， 正 如 我 们 很 快 就 会 看 到 的 那样 ， 在 进程 逻辑 空间 
的 应 用 程序 部 分 ， 有 关 页 面 有 时 甚至 不 在 内 存 中 。 但 这 对 于 操作 系统 内 核 来 说 ,往往 并 非 如 
此 ， 尽 管 作 为 内 核 部 分 的 某 些 操 作 系 统 页 面 可 能 也 会 这 样 。 总 之 ,仅仅 通过 一 个 或 几 个 页 面 
来 映射 整个 内 核能 够 使 有 关 设 置 和 操作 更 加 简单 方便 ,并且 其 至 只 需要 一 个 快 表 项 就 可 以 映 
射 整个 内 核 ， 这 是 一 个 很 大 的 优势 。 

在 一 些 后 来 的 UltraSPARC (超级 可 伸缩 处 理 器 体系 结构 ) 处 理 器 中 ， 有 关 软 件 可 以 为 ， 
应 用 程序 的 不 同 部 分 分 别 选择 各 种 不 同 的 页 面 大 小 。 我 们 将 会 在 段 页 式 一 节 看 到 相关 工作 机 
理 的 介绍 。 
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11.2.7 历史 的 注脚 


尽管 现代 系统 通常 会 在 并 发 运行 多 个 进程 的 环境 中 使 用 这 些 技术 ,但 是 在 历史 上 ， 在 仅 
仅 运 行 单个 进程 的 情况 下 就 曾经 出 现 过 使 用 分 页 技术 的 一 些 系 统 。 程 序 可 以 引用 程序 中 那些 
尚未 进入 内 存 的 部 分 ， 这 在 很 大 程度 上 就 像 它 们 在 调用 上 一 章 曾经 讨论 过 的 覆盖 例 程 一 样 。 
这 具有 一 个 优点 ， 也 就 是 允许 支持 运行 比 物理 内 存 大 得 多 的 进程 。 在 较 小 内 存 的 时 代 ， 这 是 
一 个 很 大 的 优点 ， 但 其 在 当前 的 系统 中 并 没有 被 大 量 地 利用 。 现 代 操 作 系 统 往往 使 用 的 是 请 
求 分 页 技术 ,在 后 面 的 一 节 将 会 展开 讨论 。 


11.3 “分 段 


几乎 是 在 分 页 技术 设计 的 同时 ， 另 一 种 被 称 为 分 段 (segmentation) 的 技术 也 被 设计 出 来 
并 沿 着 一 种 不 同 的 发 展 轨迹 向 前 演化 。 分 段 技术 相关 设计 主要 是 为 了 帮助 解决 与 分 页 寻 址 相 
同 的 问题 ， 但 还 包括 其 他 的 一 些 考 量 。 分 段 技术 
源 自 于 我 们 能 够 把 一 个 程序 看 作 是 由 若干 不 同 部 
分 组 成 的 观察 。 我 们 往往 会 拥有 一 个 主 例 程 ， 而 
且 也 常常 会 拥有 若干 子 程序 和 函数 ， 它 们 通常 被 
编译 右 识 别 为 单独 的 项 。 有 时 我 们 甚至 单独 编译 
子 例 程 和 函数 并 将 它们 放 入 库 中 。 我 们 还 设立 有 
相关 区 域 用 来 存放 堆栈 (或 简称 栈 )、 静 态 数据 项 、 
常量 信息 、 文 件 缓冲 区 、 通 信和 缓冲 区 ， 等 等 。 这 
些 区 域 都 可 以 各 自 单独 创建 和 控制 。 图 11-6 显示 
了 一 个 程序 的 分 段 组 成 以 及 其 加 载 到 主 存 之 后 所 
构成 的 进程 的 程序 段 集合 。 

其 中 每 一 个 部 分 都 可 以 被 认为 是 与 其 他 部 分 相 分 离 的 ， 并 且 可 以 拥有 单独 的 逻辑 寻 址 空 
间 。 例 如 ， 由 于 数据 具有 单独 的 寻 址 空间 ， 所 以 我 们 应 当 认 为 第 一 个 数据 项 存放 在 数据 段 地 
址 空间 中 的 地 址 0 处 。 于 是 ， 我 们 需要 相关 硬件 针对 所 有 关于 每 个 分 段 中 地 址 的 引用 进行 重 
新 定位 ， 有 关 方 式 与 利用 重 定位 寄存 器 针对 关于 整个 进程 的 引用 的 重新 定位 是 一 样 的 。 具 体 
而 言 ， 我 们 将 会 使 用 一 种 很 像 页 表 但 又 存在 些许 不 同 的 机 制 ， 称 之 为 段 表 ( segment table )， 
相关 样 例如 图 11-7 所 示 。 我 们 仍然 认为 逻辑 地 址 可 以 被 划分 为 两 个 部 分 ， 但 应 分 别 是 段 号 
(segment number， 在 图 中 标记 为 s) 和 偏 移 地 址 ( displacement， 在 图 中 标记 为 4) 。 采 用 分 
页 方式 时 ， 我 们 拥有 数量 相当 多 但 尺寸 却 相当 小 的 页 面 ， 所 以 有 关 偏 移 地 址 所 占 位 数 不 是 很 
多 ， 但 页 号 所 占 位 数 较 多 。 而 对 于 分 段 方式 来 说 ， 我 们 则 拥有 相对 较 少 数量 的 分 段 ， 但 每 个 
分 段 本 身 则 可 能 相当 大 ， 因 此 段 号 通常 所 占 位 数 不 是 很 多 ， 但 段 内 的 偏 移 地 址 所 占 位 数 则 较 
多 。 此 外 ， 页 表 中 的 表 项 包含 的 是 页 框 号 ， 而 段 表 中 的 表 项 包含 的 则 是 内 存 地 址 。 通 常情 况 
下 ,程序 设计 人 员 不 会 对 分 段 施 加 任何 公开 的 控制 。 而 编译 器 将 会 为 正在 编译 的 模块 的 主要 
部 分 一 一 程序 代码 、 堆 栈 、 堆 、 全 局 变量 等 一 一 生成 单独 的 分 段 ， 并 在 目标 模块 中 放置 上 对 
它们 的 符号 引用 。 链 接 器 将 会 分 配 实 际 的 段 号 ， 这 些 段 号 在 链接 器 把 相关 目标 模块 合并 到 可 
执行 二 进 制 程序 时 或 者 在 操作 系统 实现 库 模 块 的 动态 加 载 时 将 会 用 到 。 

在 图 11-7 中 ， 我 们 可 以 看 到 对 包含 子 程序 A 的 分 段 的 一 个 内 存 引 用 。 有 关 硬 件 将 会 用 
到 由 逻辑 地 址 的 段 号 所 指定 的 段 表 项 。 它 将 会 提取 对 应 段 表 项 中 所 找到 的 相应 分 段 地 址 指 


图 11-6 进程 分 段 
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针 ， 并 将 其 与 逻辑 地 址 的 段 内 偏 移 地 址 部 分 进行 相 加 ， 从 而 计算 获得 对 应 的 物理 地 址 。 而 支 
持 分 页 方式 的 相关 硬件 只 是 用 页 框 号 把 页 号 蔡 换 掉 即 可 ， 其 根据 在 于 页 框 的 大 小 和 页 面 的 大 
小 总 是 相同 的 ， 所 以 页 框 和 页 面 也 总 是 沿 着 块 边界 来 确定 位 置 的 。 但 是 ， 由 于 分 段 具有 可 变 
的 大 小 ， 所 以 它们 可 以 位 于 任何 地 方 ， 因 此 我 们 应 当 通 过 使 用 段 表 给 出 的 相应 分 段 指针 加 上 
偏 移 地 址 来 获得 物理 内 存 地 址 。 请 注意 ， 就 像 分 页 方式 一 样 ， 采 用 分 段 方式 也 会 对 每 次 访问 
产生 额外 的 内 存 引 用 开销 。 故 而 ,采用 分 段 的 系统 也 应 当 利 用 快 表 来 提高 访问 速度 。 





图 11-7 主 存 中 的 段 表 和 分 段 


鉴于 分 段 可 以 在 任何 地 方 并 且 各 分 段 的 大 小 不 是 全 部 一 样 的 ， 所 以 仅 赁 这 些 尚 不 构成 避 
免 外 部 碎片 的 最 佳 解决 方案 。 也 就 是 说 ， 我 们 仍然 必须 得 跟踪 内 存 空 穴 ， 我 们 仍然 无 法 分 配 
小 片 的 内 存 。 为 此 ,我 们 应 当 设 定 某 种 最 小 颗粒 度 一 一 譬如 说 1024 字 节 。 因 此 ， 我 们 可 能 
将 会 产生 一 些 内 部 碎片 。 但 是 ， 现 在 的 空 穴 大 小 的 范围 将 会 比 我 们 在 监测 整个 进程 时 所 考虑 
的 空 穴 大 小 的 范围 要 小 些 ， 因 为 我 们 把 每 个 进程 分 解 成 为 (很 可 能 是 许多 的 ) 分 段 。 总 之 ， 
与 针对 整个 进程 的 内 存 管 理 相 比 ， 我 们 在 外 部 碎片 方面 所 面临 的 问题 已 有 所 缓解 。 

由 于 分 段 具 有 可 变 的 大 小 ， 所 以 我 们 必须 得 为 系统 提供 一 种 地 址 检查 的 途径 ， 以 便 我 们 
可 以 确保 进程 不 会 在 对 应 分 段 的 界限 之 外 寻 址 。 每 个 分 段 的 界限 应 当 与 指向 该 分 段 的 指针 一 
起 存放 在 段 表 中 。 正 如 我 们 前 面 围绕 分 页 机 制 所 讨论 的 那样 ， 鉴 于 各 分 段 具 有 不 同 的 目的 ， 
我 们 还 可 以 通过 限制 对 各 个 分 段 进行 的 访问 类 型 来 增强 我 们 对 系统 所 提供 的 保护 。 通 常情 况 
下 ， 每 个 分 段 可 以 设立 一 组 标志 位 ， 以 用 于 控制 我 们 可 以 实施 的 访问 类 型 。 例 如 ， 一 个 数据 
常量 分 段 可 以 被 标记 为 只 读 ， 程 序 分 段 可 以 被 标记 为 只 执行 ， 而 堆栈 和 数据 分 段 应 当 被 标记 
为 允许 读 和 写 但 不 可 执行 。 

在 一 些 操作 系统 中 ， 若 干 进程 共享 相同 分 段 是 被 支持 的 。 例 如 ， 我 们 可 能 拥有 几 个 用 户 
同时 运行 一 个 程序 编辑 器 。 为 此 ,我们 可 以 为 每 个 用 户 创建 一 个 进程 ， 并 在 各 个 进程 的 段 表 
中 进行 代码 段 的 映射 且 使 它们 都 指向 物理 内 存 的 相同 部 分 。 如 果 我 们 拥有 标准 语言 的 通用 运 
行 时 库 ， 即 使 是 对 于 不 同 的 程序 ， 我 们 也 可 以 映射 有 关 分 段 指向 相同 的 物理 内 存 分 段 。 对 于 
操作 系统 来 说 ， 关 于 牵涉 多 个 进程 的 段 号 的 管理 往往 可 能 比较 繁琐 。 

通常 情况 下 ， 用 高 级 语言 编写 程序 的 程序 员 不 会 意识 到 被 操作 系统 所 使 用 的 分 段 机 制 ， 
而 只 有 当 他 们 的 程序 产生 分 段 错误 时 才 会 有 所 察觉 ， 且 相关 分 段 错误 大 多 数 情况 是 由 用 作 堆 
栈 的 分 段 的 溢出 所 引起 的 。 一 般 来 说 ， 编 译 器 和 链接 器 负责 通过 调用 管理 段 号 的 操作 系统 例 
程 来 为 各 个 分 段 分 配 段 号 。 而 同 低级 语言 打交道 的 程序 设计 人 员 则 需要 了 解 分 段 以 及 操作 系 
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统 关 于 分 段 的 使 用 方法 ， 并 且 如 果 需 要 ， 他 们 还 可 以 控制 分 段 。 另 外 ，Windows NT 系列 没 
有 使 用 分 段 机 制 ， 其 理由 是 分 段 在 许多 硬件 设计 上 没有 需要 、 在 英特尔 以 外 的 其 他 设备 上 不 
可 用 并 且 使 用 分 段 机 制 会 降低 软件 的 可 移植 性 。Linux 仅 以 有 限 的 方式 来 使 用 分 段 ， 具 体 我 
们 将 会 在 下 一 节 中 进行 讨论 。 而 大 数 UNIX 衍生 的 操作 系统 则 使 用 段 页 式 内 存 管理 方式 ， 同 
样 也 将 在 下 一 节 展 开 讨 论 。 


11.4 段 页 式 


分 页 和 分 段 之 间 存 在 着 根本 区 别 。 分 页 对 运行 的 进程 是 透明 的 。 对 于 一 个 应 用 程序 来 
说 ， 如 果 其 原先 创建 是 运行 在 有 关 进 程 将 被 映射 到 一 个 单一 内 存 分 区 的 操作 系统 中 的 ， 那 么 
其 有 可 能 不 用 更 改 就 可 以 运行 在 使 用 分 页 存储 器 架构 的 系统 上 。 男 一 方面 ， 分 段 则 要 求 程序 
以 某 种 方式 被 结构 化 ， 以 便 它们 被 划分 为 具有 不 同 地 址 空间 的 若干 逻辑 部 分 。 关 于 分 页 和 分 
段 ， 一 个 很 有 意思 的 方案 是 ， 利 用 适当 的 硬件 设计 ， 我 们 便 可 以 将 分 段 程序 体系 结构 与 分 页 
内 存 体系 结构 有 机 地 结合 到 一 起 ， 称 之 为 段 页 式 内 存 管理 。 在 各 种 操作 系统 的 文档 中 ， 分 段 
可 能 被 称 为 区 域 (region) 或 内 存 区 域 (memory area)。 就 段 页 式 内 存 管理 而 言 ， 其 分 段 的 工 
作 机 理 与 我 们 已 经 描述 的 分 段 方 式 基本 一 样 ， 只 是 所 生成 的 地 址 没有 用 作物 理 内 存 地 址 ， 而 
是 被 视 为 逻辑 地 址 并 进一步 通过 分 页 机 制 进行 转换 。 这 样 就 允许 我 们 既 可 以 拥有 针对 分 段 引 
用 访问 方式 的 精确 控制 ， 又 可 以 拥有 分 页 机 制 固定 页 面 大 小 所 带 来 的 没有 外 部 碎片 的 好 处 。 

关于 分 段 和 分 页 的 结合 ， 一 般 存在 两 种 不 同 的 方式 。 第 一 种 设计 起 源 于 Multics 项 目 9。 
在 这 种 设计 方案 中 ， 我 们 将 会 为 进程 的 每 个 分 段 配备 一 个 页 表 ， 而 不 是 为 整个 进程 设立 唯一 
的 一 个 页 表 。 相 关 设 计 如 图 11-8 所 示 。 首 先 ， 根据 地 址 的 分 段 部 分 在 段 表 中 进行 查找 ， 并 
返回 一 个 指向 页 表 的 指针 ， 该 页 表 实 现 了 分 段 内 页 号 到 物理 内 存 中 页 框 号 的 映射 。 236 


《每 个 分 假 “| 用 
一 个 分 段 页 表 ) [ee 





图 11-8 传统 段 页 式 内 存 管理 


第 二 种 设计 方案 被 用 于 更 现代 的 系统 中 。 对 于 这 种 设计 方案 而 言 ， 仍 然 有 一 个 段 表 ， 但 
其 不 是 指向 每 个 分 段 的 单独 页 表 。 换 名 话说 ， 段 表 中 的 地 址 在 于 一 个 线性 地 址 空间 范围 内 ， 
其 将 会 以 与 分 页 式 系统 相同 的 方式 映射 到 物理 内 存 中 。 相 关 设 计 如 图 11-9 所 示 。 在 这 种 情 


O http://www.multicians.org/fjcel1.html 
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况 下 ， 段 表 项 描述 了 线性 地 址 空间 的 一 部 分 ， 而 这 部 分 线性 地 址 空间 可 以 被 看 作 是 对 应 于 相 
应 分 段 的 页 表 。 但 是 ， 就 有 关 硬 件 而 言 ， 它 只 是 单一 页 表 的 一 部 分 。 


( 每 个 进程 
一 个 进程 页 表 ) 国 | 


图 11-9 现代 段 页 式 内 存 管 理 (或 称 为 线性 寻 址 式 分 段 内 存 管理 ) 





大 多 数 现代 操作 系统 以 这 样 或 那样 的 形式 采用 了 第 二 种 机 制 ， 但 是 ， 它 们 往往 限制 了 有 
关 分 段 的 使 用 。 例 如 ,在 Linux 系统 中 ， 除 了 有 一 个 分 段 用 来 描述 整个 运行 进程 外 ， 仅 仅 将 
分 段 机制 用 于 内 核 的 处 理 。 同 时 ， 有 关 分 段 经 常 被 用 来 限制 寻 址 和 控制 访问 。 例 如 ， 两 个 分 
段 可 同时 被 用 于 映射 到 相同 的 内 核 地 址 空间 。 其 中 一 个 用 于 程序 的 执行 ， 故 而 可 被 设置 为 允 
许 执行 但 不 能 读 取 或 写 入 。 另 一 个 则 用 于 数据 的 访问 ， 故 而 可 被 设置 为 允许 读 取 和 写 入 但 不 
允许 执行 。 另 外 ， 还 有 一 个 分 段 可 用 于 运行 时 堆栈 的 访问 ， 以 便 允 许 硬件 机 制 能 够 有 效 地 进 
行 堆栈 溢出 的 动态 检查 。 


11.5 请求 分 页 

到 目前 为 止 ， 我 们 一 直 假 设 当 一 个 程序 被 装 入 内 存 时 ， 整 个 程序 将 被 加 载 到 内 存 并 且 会 
为 逻辑 寻 址 空间 中 的 每 个 页 面 分 配 一 帧 物理 内 存 ( 即 一 个 物理 块 或 一 个 页 框 )。 然 而 ， 最 终 
意识 到 这 是 没有 必要 的 。 在 程序 运行 的 过 程 中 ， 它 们 并 不 会 真正 地 随机 访问 地 址 而 遍及 其 整 
个 逻辑 地 址 空间 。 代 码 段 中 的 指令 在 很 大 程度 上 是 被 顺序 访问 的 ， 因 此 对 于 大 约 一 千 条 指令 
而 言 ， 我 们 可 能 在 逻辑 地 址 空间 的 代码 部 分 中 也 就 访问 单个 的 一 个 页 面 而 已 。 或 者 程序 可 能 
会 进入 一 个 循环 ， 有 时 是 相当 长 的 一 段 时 间 ， 一直 停留 在 某 个 单一 的 代码 页 面 上 面 。 诚然， 
我 们 会 频繁 地 调用 库 函 数 ， 而 这 又 可 能 会 调用 其 他 的 库 函 数 。 程 序 还 会 一 步 步 地 处 理 一 个 数 
组 ， 或 者 扫描 一 个 字符 串 ， 或 者 搜索 一 条 传人 的 消息 。 当 我 们 把 一 个 程序 的 执行 过 程 划分 成 
一 系列 小 的 时 段 并 仔细 查看 在 各 时 段 中 内 存 引 用 所 访问 的 相应 页 面 时 ， 我 们 往往 会 发 现在 任 
意 给 定 的 时 段 中 有 关 进 程 仅仅 访问 到 了 有 限 的 几 个 页 面 。 这 种 现象 在 操作 系统 设计 中 非常 重 
要 ， 被 称 为 引用 的 局 部 性 (locality of reference)。 我 们 在 缓存 机 制 以 及 我 们 许多 其 他 的 操作 
系统 算法 中 都 用 到 了 这 一 相同 的 理念 。 

利用 这 种 现象 而 开发 的 相关 技术 被 称 为 请 求 分 页 ( demand paging， 或 称 为 请 求 调 页 )。 
其 想法 是 ， 我 们 应 当 对 页 表 项 中 的 有 效 位 的 含义 稍微 进行 一 下 调整 ， 而 与 该 有 效 位 的 使 用 相 
关联 的 硬件 无 须 进 行 任 何 改变 。 进 一 步 说 ， 该 有 效 位 用 来 标示 对 应 页 面 尚未 分 配 页 框 。 在 我 
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们 以 前 的 设计 中 ， 有 效 位 则 意味 着 对 应 页 面 位 于 当前 程序 的 逻辑 地 址 空间 之 外 。 现 在 ， 有 效 
位 仍然 可 以 用 来 标示 这 一 含义 ， 不 过 也 有 可 能 仅仅 指示 当前 没有 物理 页 框 被 映射 到 对 应 页 
面 。 当 我 们 加 载 第 一 个 页 面 时 ， 我 们 将 会 把 其 有 效 位 设置 为 真 ， 以 指示 该 页 面 已 在 内 存 中 。 
同时 ， 我 们 将 会 把 其 他 的 每 一 个 页 面 的 有 效 位 设置 为 用 以 标示 对 应 页 面 不 在 内 存 中 的 情形 。 
然后 ,我 们 将 启动 程序 的 运行 。 从 理论 上 来 说 ,我 们 甚至 不 用 把 任何 页 面 加 载 进 入 物理 内 存 
就 可 以 启动 一 个 程序 的 执行 。 操 作 系统 可 能 只 是 通过 转向 执行 内 存 中 当前 进程 的 方式 ， 就 触 
发 了 页 面 故 障 机 制 ， 进 而 把 对 应 程序 的 第 一 页 装 人 内 存 。 这 被 称 为 延迟 加 载 (lazy loading ) 。 
即便 我 们 加 载 装 人 了 程序 的 第 一 个 页 面 ， 但 它 
很 快 将 会 引用 到 尚未 进入 内 存 的 另 一 个 页 面 中 
的 数据 。 图 11-10 就 显示 了 此 类 页 表 的 一 个 示 
例 。 于 是 ， 有 关 引 用 将 会 获取 页 表 项 ， 而 该 页 
表 项 有 效 位 的 设置 将 会 触发 一 个 “内 存 寻 址 错 
误 ” 的 中 断 。 在 这 种 情况 下 ， 内 存 管理 子 系统 
将 会 查看 对 应 引用 ， 以 确认 该 引用 是 否 引 用 了 
一 个 确实 是 在 当前 程序 的 逻辑 地 址 空间 但 尚未 
装 人 内 存 的 页 面 。 而 如 果 有 关 引 用 并 不 是 引用 


页 表 
了 当前 进程 的 逻辑 地 址 空间 中 的 一 个 页 面 ， 则 (在 内 存 中 ) 
说 明 对 应 程序 犯 了 一 个 错误 ， 应 抛 出 一 个 寻 址 11-10 请 求 分 页 式 页 表示 例 


异常 ， 很 有 可 能 会 中 止 对 应 进程 。 

如 果 引 发 故障 的 地 址 是 在 进程 的 逻辑 地 址 空间 中 ， 那 么 相应 页 面 仅仅 是 当前 未 被 映射 到 
物理 内 存 而 已 ， 或 者 是 因为 其 从 未 被 装 入 内存， 或 者 是 已 经 从 内 存 中 移 除 。 这 种 条 件 被 称 为 
页 面 故 障 ( page fault， 或 称 为 缺 页 )。 于 是 ， 内 存 管理 子 系统 将 会 请 求 从 辅助 存储 器 读 取 对 
应 页 面 ， 同 时 操作 系统 将 把 相应 程序 置 为 等 待 状态 ， 直 到 相关 读 入 操作 完成 为 止 。 一 旦 对 应 
页 面 被 读 人 内 存 ， 操 作 系统 将 会 更 新 页 表 使 其 指向 新 的 页 框 ， 将 对 应 表 项 标记 为 有 效 ， 并 且 
重新 启动 产生 页 面 故障 的 进程 使 其 从 触发 故障 的 指令 处 继续 运行 。 请 注意 ， 这 一 机 制 对 应 用 
程序 仍然 是 透明 的 。 换 句 话 说， 应 用 程序 设计 人 员 通 常 不 需要 知道 有 关 进 程 的 执行 状况 ， 更 
不 用 说 采取 任何 操作 措施 了 。 

在 某 些 情况 下 ， 这 将 允许 我 们 运行 那些 非常 庞大 以 至 于 内 存 空间 无 法 容纳 下 的 程序 。 
“80/20 规则 ”通常 是 成 立 的 一 一 一 个 程序 80% 的 代码 是 编写 用 来 处 理 只 会 在 20% 的 情况 下 
发 生 的 事情 。 因 此 ， 在 许多 情况 下 ， 有 关 程 序 80% 部 分 中 的 大 部 分 将 永远 不 会 被 加 载 到 内 
存 中 。 作 为 一 个 额外 的 好 处 ， 这 将 允许 我 们 的 程序 启动 得 更 加 快捷 ， 因 为 如 果 一 个 页 面 从 未 
引用 过 ， 我们 就 不 用 把 它 加 载 到 内 存 中 。 同 样 ， 在 我 们 试图 运行 许多 程序 的 环境 中 ,或 许可 
能 是 多 用 户 环境 ， 在 给 定 的 物理 内 存 容量 的 前 提 条 件 下 ， 总 体 而 言 我 们 将 能 够 同时 运行 更 多 
的 程序 。 


11.5.1 请 求 分 页 方式 下 的 有 效 内 存 访问 时 间 


或 许 你 还 记得 ， 当 我 们 第 一 次 评判 分 页 机 制 时 ， 我 们 曾 领 会 到 页 表 使 用 本 身 是 如 何 让 
有 效 的 内 存 访问 时 间 翻 倍 的 。 这 便 需 要 引入 快 表 机 制 来 缓存 工作 集中 的 相关 页 面 引用 的 页 框 
号 。 现 在 考虑 一 下 ， 当 我 们 访问 一 个 不 在 内 存 中 的 页 面 时 ， 有 关 访 问 时 间 将 会 发 生 什么 样 的 
变化 。 我 们 的 有 效 访 问 时 间 将 会 包括 四 方面 的 组 成 要 素 ， 如 表 11-1 所 示 。( 表 中 所 显示 的 速 





196  ， 荔 三 刻 分 、 处 理 器 管理 玉 内 阅 管 理 


B39] 度 仅 仅 是 近似 的 相对 速度 ， 而 不 是 具体 的 期 望 值 。) 


表 11-1 请 求 分 页 有 效 寻 址 时 间 


人 | 


如 表 所 示 ， 相 对 而 言 ， 磁 盘 输 入 /输出 所 花费 的 时 间 大 大 超过 了 内 存 的 访问 时 间 。 于 
是 ,根据 这 种 支配 状况 产生 了 若干 种 机 制 。 有 关机 制 乍 一 看 起 来 极其 复杂 ， 但 它们 仅仅 是 为 
了 避免 执行 单一 的 磁盘 输入 /输出 操作 (服务 于 请 求 分 页 ) 而 开发 的 。 


11.5.2 ”工作 集 与 页 面 置换 


迄今 为 止 ， 我 们 一 直 假设 在 内 存 中 有 足够 的 空闲 页 面 可 以 加 载 我 们 所 需 ( 即 当 进 程 引用 
时 ) 的 任何 页 面 。 遗 憾 的 是 ， 我 们 经 常 很 快 就 会 用 完 空 闲 页 面 。 在 这 时 候 ， 我 们 便 需 要 移 除 
当前 在 内 存 中 的 某 些 页 面 ， 而 这 往往 不 会 给 我 们 带 来 任何 问题 。 当 一 个 程序 运行 时 ， 它 将 会 
引用 某 组 页 面 一 一 包括 主 程序 中 的 一 个 页 面 ， 还 有 或 许 是 几 页 的 库 例 程 、 输 入 和 输出 的 缓冲 
区 以 及 确定 无 疑 的 几 页 数据 。 进 程 在 一 个 较 短 的 时 间 段 内 所 引用 的 这 组 页 面 被 称 为 工作 集 
( working set)。 通 常情 况 下 ， 我 们 在 被 称 为 滑动 窗口 ( sliding window) 的 某 个 固定 时 间 间 隔 上 
测度 工作 集 。 

例如 ， 假 设 某 进程 拥有 包含 标记 为 1 一 7 的 7 个 页 面 的 逻辑 地 址 空间 ， 并 且 关 于 这 些 页 
面 的 引用 序列 如 下 所 示 : 


;| 


我 们 将 通过 查看 最 近 的 4 个 引用 来 监测 相应 的 工作 集 。 伴 随 这 个 引用 序列 的 逐渐 展开 ， 
有 关 的 工作 集 将 会 发 生 改 变 ， 如 表 11-2 所 示 。 在 进程 运行 的 过 程 中 ， 有 关 工 作 集 通常 会 B 
时 间 而 发 生变 化 。 特 别 地 ， 发 现 一 个 进程 拥有 在 内 存 的 若干 页 面 但 不 再 被 引用 ， 这 是 很 正常 
的 。 在 上 面 的 页 面 引用 序列 中 ， 我 们 可 以 看 到 第 5 个 页 面 在 步骤 4 之 后 就 没有 再 被 引用 过 ， 
所 以 我 们 可 以 从 内 存 移 除 该 页 面 。 我 们 想 要 做 的 就 是 识别 这 样 的 页 面 ， 并 在 我 们 不 再 需要 它 
们 的 时 候 把 它们 从 内 存 中 移 除 出 去 。( 把 我 们 所 认为 的 可 能 不 再 需要 的 页 面 移 除 出 去 称 为 页 
面 替 换 、 页 面 置换 或 页 面 淘 汰 。) 但 令 人 遗憾 的 是 ， 我们 往往 无 法 真正 做 到 此 类 识别 。 我 们 
在 一 段 时间 内 没有 引用 一 个 页 面 ， 并 不 意味 着 下 一 条 指令 就 一 定 不 会 引用 这 个 页 面 。 在 上 面 
的 页 面 引用 序列 中 ， 我 们 可 以 看 到 第 2 个 页 面 在 步骤 2 和 步骤 13 之 间 没 有 被 引用 过 ， 故 而 
我 们 不 再 把 它 看 作 是 在 工作 集中 (如 表 11-2 所 示 )， 因 为 我 们 查看 的 仅仅 是 一 个 4 步 的 滑动 
窗口 。 幸 运 的 是 ， 从 内 存 中 移 除 一 个 后 来 还 会 需要 的 页 面 并 不 会 造成 任何 破坏 。 其 导致 的 结 
果 仅 仅 只 是 不 那么 高 效 而 已 。 具 体 而 言 ， 针 对 相应 页 面 的 下 一 次 引用 将 会 导致 一 个 页 面 故 
障 ， 从 而 使 该 页 面 被 再 次 提取 。 

有 一 种 非常 简单 的 页 面 淘汰 策略 ， 即 先进 先 出 ( First In First Out，FIFO) 淘汰 算法 。 在 
该 算法 中 ， 操 作 系 统 需 要 为 每 个 进程 保存 一 张 根据 相应 页 面 加 载 进 入 内 存 的 次 序 而 形成 的 页 
号 队列 ， 并 在 需要 时 强制 移 除 最 早 进 入 内 存 的 相关 页 面 。 这 种 算法 是 一 种 开销 较 低 的 算法 ， 
只 需要 操作 系统 付出 很 少 的 开销 。 然 而 ， 尽 管 先 进 先 出 算法 成 本 较 低 上 且 易 于 理解 和 实现 ， 但 
是 它 性 能 差 且 不 太 稳定 ， 因 此 如 今 很 少 被 人 利用 。 这 种 算法 曾 在 VAX/VMS 操作 系统 中 使 用 
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过 。 此 外 ， 该 算法 被 检测 证 实 会 发 生 贝 菜 迪 异常 现象 ( 译 者 注 : Belady’s anomaly， 即 缺 页 
率 会 随 着 所 分 配 得 到 的 页 框 数 的 增多 而 增 大 的 现象 ) 。 


表 11-2 工作 集 监测 示例 


理论 上 而 言 ， 存 在 一 种 最 佳 页 面 淘汰 ( Optimal Page Replacement，OPT) 算法 。 其 工作 
机 理 如 下 : 当 需 要 淘汰 某 个 页 面 时 ， 操 作 系统 将 会 把 对 应 下 一 次 使 用 是 将 来 最 长 时 间 的 那个 
页 面 淘汰 出 去 。 例 如 ， 相 对 于 从 现在 开始 在 10ms 时 将 被 使 用 的 一 个 页 面 来 说 ， 那 个 从 现在 
开始 在 200ms 时 才 会 被 使 用 的 页 面 将 会 被 优先 选中 和 了 予以 淘汰 。 这 种 算法 在 一 般 情况 下 是 
无 法 使 用 的 ， 因 为 ， 除 非 是 在 极其 限定 的 情况 下 ， 和 否则 根本 不 可 能 知道 过 多 长 时 间 一 个 页 面 
将 会 被 使 用 。 不 过 ， 如 果 这 种 算法 可 以 实现 ， 那 么 它 将 会 是 我 们 能 够 做 到 的 最 好 的 算法 ， 所 
以 值得 讨论 一 番 。 假 设 我 们 拥有 仅仅 3 个 空闲 的 页 框 来 运行 一 个 进程 ， 如 果 我 们 针对 前 面 
所 给 出 的 页 面 引用 序列 来 使 用 最 佳 页 面 淘汰 算法 ， 那 么 ， 将 会 产生 9 次 页 面 故障 ( 即 缺 页 中 
断 )， 包 括 加 载 前 3 个 页 面 所 对 应 的 相应 页 面 故障 。 

还 有 若干 种 其 他 的 机 制 我 们 也 可 以 用 来 选择 要 淘汰 的 页 面 。 一 种 方案 是 试图 推算 出 哪个 
页 面 是 最 长 时 间 未 被 引用 的 。 正 如 通常 所 说 的 ， 这 个 页 面 就 是 最 近 最 久未 使 用 的 ( Least 
Recently Used，LRU) 那个 页 面 。 我 们 将 做 这 样 的 假设 ， 这 个 页 面 就 是 最 有 可 能 不 再 被 使 用 
的 那个 页 面 ， 故 而 我 们 将 把 它 从 内 存 中 移 除 出 去 。 如 果 我 们 试图 实际 来 保存 每 个 页 面 的 最 后 
一 次 引用 的 时 间 ， 我们 最 终 将 需 为 每 个 实际 的 内 存 引 用 创建 至 少 一 个 额外 的 内 存 引 用 。 因 
此 ， 实 际 的 操作 系统 并 不 直接 实现 最 近 最 久未 使 用 淘汰 算法 。 然 而 ,借助 于 某 些 硬件 功能 ， 
我 们 可 以 识别 某 段 时 间 内 没有 被 使 用 的 有 关 页 面 。 利 用 相关 功能 的 最 简单 的 算法 称 为 时 钟 算 
法 9 ( clock algorithm)。 仅 仅 付 出 相当 低 的 代价 〈 就 额外 的 内 存 引 用 而 言 )， 有 关 硬 件 便 可 以 
确保 在 一 个 页 面 被 引用 时 ， 页 表 项 中 的 某 个 二 进 制 位 被 置 为 1。 这 一 位 通常 被 称 为 页 面 引 用 位 
(page reference bit)， 有 时 也 被 称 为 存 取 位 (access bit， 或 称 为 访问 位 ) 或 使 用 位 (use bit)。( 如 
图 11-11 所 示 。) 当 一 个 页 面 (通过 页 表 ) 被 引用 时 ， 有 关 硬 件 
将 会 检查 对 应 页 表 项 中 的 页 面 引用 位 。 如 果 它 已 经 被 设置 为 
1， 那 么 无 须 进行 任何 操作 。 如 果 它 没有 被 设置 为 1， 那么 就 es 
将 它 设 置 为 1， 这 可 能 会 花费 一 个 额外 的 内 存 周 期 的 开销 。 有 
时 ， 操 作 系统 可 能 会 针对 当前 在 内 存 中 的 相关 页 执行 这 些 位 的 上 rio 
清 零 操 作 。 我 们 把 页 表 中 的 所 有 页 面 的 有 关 位 进行 清 零 ， 让 对 图 11-11 页 面 引 用 位 与 有 效 位 


心中 | 上 PP | 一 


页 面 引 用 位 


唱 这 个 未 必 恰 当 或 者 说 算 不 上 成 功 的 术语 并 没有 参考 系统 时 钟 。 它 只 是 指 这 样 的 设想 ， 即 当 操作 系统 到 达 
页 面 引 用 列表 未 尾 的 时 候 ， 就 会 从 头 开始 再 来 ， 这 非常 像 一 个 时 钟 掠 过 12 的 时 候 再 返回 1 继续 的 情况 。 
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应 进程 运行 一 段 时 间 。 在 此 期 间 ， 有 关 硬 件 将 会 为 所 有 被 引用 的 页 面 的 对 应 页 表 项 的 页 面 引 
用 位 进行 设置 操作 。 当 我 们 需要 查找 一 个 页 面 从 内 存 中 移 除 的 时 候 ， 我 们 将 会 搜索 相关 表 
格 ， 并 找到 一 个 有 效 位 为 1 但 引用 位 为 0 的 页 面 。 这 样 的 页 面 将 是 被 淘汰 页 面 的 一 个 很 好 的 
候选 页 面 。 

我 们 也 可 以 对 这 种 机 制 稍微 进行 一 下 加 强 。 对 于 每 一 个 页 面 ， 我 们 可 以 保存 关于 页 面 引 
用 位 相关 设置 以 往 历史 的 一 个 字 节 或 者 更 多 字 节 的 信息 ， 称 为 引用 计数 ( reference count)。 
这 种 机 制 有 时 被 称 为 老龄 化 (aging) 技术 。 在 我 们 周期 性 地 对 页 面 引用 位 进行 清 零 操 作 时 ， 
我 们 首先 将 引用 计数 右 移 一 位 ， 然 后 把 对 应 页 面 引用 位 的 最 新 取 值 移 到 引用 计数 的 最 高 位 
上 。 如 果 某 个 页 面 在 上 一 个 周期 中 曾 被 引用 过 ， 那 么 对 应 计数 将 因而 具有 高 的 取 值 。 伴 随 其 
间 该 页 面 未 被 引用 的 刷新 周期 的 经 过 ， 有 关 移 位 操作 将 会 实际 上 对 相应 引用 计数 执行 每 次 整 
除 2 的 操作 ， 所 以 引用 计数 会 变 得 越 来 越 小 。 图 11-12 显示 了 一 个 页 面 的 引用 计数 示例 ， 在 
最 近 的 两 个 刷新 周期 中 ， 移 人 高 位 的 二 进 制 位 是 零 ， 因 此 每 次 这 个 引用 计数 就 会 变 得 更 小 。 
当 我 们 需要 淘汰 一 个 页 面 时 ， 我 们 优先 选择 具有 最 小 引用 计数 的 页 面 。 综 上 所 述 ， 单 一 的 引 
用 位 只 能 用 来 标明 最 近 的 时 间 间 隔 中 对 应 的 页 面 是 否 被 引用 过 ， 而 通过 引用 计数 ， 则 可 以 使 
我 们 更 好 地 了 解 相 关 页 面 在 最 近 一 段 时 间 的 使 用 历史 。 


页 面 引用 位 
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每 次 右 移 引用 位 将 被 清 零 
图 11-12 页 表 项 及 所 关联 的 引用 计数 示例 


11.5.3 ” 脏 页 


对 于 一 道 程序 的 代码 部 分 加 载 到 某 个 内 存 页 面 且 后 来 我 们 又 将 其 淘汰 和 用 别 的 什么 东西 
来 蔡 换 对 应 页 面 的 情况 ,我们 并 不 需要 保存 该 页 面 到 任何 地 方 ， 因 为 如 果 相 关 代码 部 分 被 再 
次 引用 ， 那 么 我 们 可 以 直接 找到 原始 程序 并 获得 相应 的 页 面 。 这 也 正 是 为 什么 程序 不 应 该 在 
其 运行 时 修改 自身 的 诸多 原因 之 一 。 但 是 ， 如 果 一 个 页 面包 含有 数据 ， 并 且 自 从 该 页 面 加 载 
到 内 存 以 来 ， 其 中 的 某 些 内 容 又 发 生 了 更 改 ， 那 么 我 们 不 能 只 是 仅仅 替换 页 面 就 完事 的 一 一 
我 们 必须 保存 该 页 面 中 的 当前 数据 ， 以 备 其 被 再 次 引用 。 我 们 把 修改 过 的 页 面 称 为 脏 页 
(dirty page， 或 称 为 脏 页 面 )。 我 们 将 会 把 那些 脏 页 面 写 到 辅助 存储 器 中 的 特定 的 地 方 ， 有 关 
位 置 被 形象 地 称 为 对 换文 件 (swap file) 或 后 备 存储 器 ( backing store)。 这 个 对 换文 件 也 因 
而 充当 了 系统 主 存 的 扩展 空间 。 这 也 是 术语 虚拟 内 存 ( virtual memory) 的 起 源 。 一 般 而 言 ， 
该 对 换文 件 往往 可 能 会 比 主 存 大 许多 倍 。 在 某 些 操作 系统 中 ， 该 对 换文 件 的 的 确 确 是 常规 文 
件 空间 中 的 一 个 文件 ， 但 在 其 他 的 一 些 操作 系统 中 ， 该 对 换文 件 则 位 于 常规 文件 系统 之 外 的 
磁盘 空间 的 特殊 块 中 。 无 论 哪 一 种 情况 ， 这 种 对 换文 件 都 是 由 相应 的 操作 系统 以 一 种 特殊 的 
方式 来 进行 访问 的 ， 也 就 是 说 ， 有 关 访 问 没 有 经 过 普通 的 文件 系统 接口 ， 而 是 采用 了 原始 模 
式 的 输入 /输出 例 程 。 此 外 ， 对 于 某 些 操作 系统 来 说 ， 只 有 一 个 这 样 的 文件 ， 但 对 于 另外 的 
一 些 操作 系统 来 说 ， 则 可 能 把 若干 单独 的 对 换文 件 存放 到 不 同 的 驱动 器 上 以 提高 系统 性 能 。 


党 11 竟 高 级 的 内 疗 营 理 199 


11.5.4 ”其 他 的 页 面 淘汰 算法 


现代 操作 系统 使 用 各 种 各 样 的 算法 来 试图 优化 页 面 淘汰 过 程 。 其 中 有 一 种 算法 称 为 二 
次 机 会 算法 ( second chance algorithm)。 这 种 算法 是 在 时 钟 算法 基础 上 修改 而 形成 的 ， 它 以 
我 们 首次 关于 时 钟 算法 所 描述 的 方式 来 检查 页 表 ， 以 查找 未 被 引用 的 一 个 页 面 。 但 是 ， 当 利 
用 这 种 算法 检查 每 个 页 面 时 ， 如 果 它 发 现 相 应 引用 位 设置 为 1， 则 做 清 零 操作 。 通 过 这 种 方 
式 ， 这 种 算法 就 更 新 了 引用 位 ， 使 其 来 进一步 反映 比 最 近 的 引用 刷新 周期 更 晚 的 一 段 时 间 的 
引用 情况 。 伴 随 这 种 算法 在 页 表 中 的 前 移 查 找 ， 如 果 其 在 第 一 轮 查 找 过 程 中 没有 找到 任何 空 
闲 的 页 面 ， 那 么 它 应 当 在 第 二 轮 查找 过 程 中 能 够 找到 某 个 空闲 的 页 面 。 在 某 些 操 作 系 统 中 ， 
这 种 页 面 搜索 过 程 是 由 后 台 进 程 而 不 是 页 面 置换 进程 来 完成 的 。 如 果 系 统 中 的 空闲 内 存 空 间 
非常 少 ， 那 么 相对 于 可 用 内 存 比 较 充 裕 的 情况 ， 操 作 系 统 将 会 更 为 频繁 地 运行 这 个 后 台 进 程 
并 且 往 往 会 运行 较 长 的 时 间 。 而 如 果 空 闲 内 存 不 是 时 下 引起 关注 的 原因 所 在 ， 那 么 该 后 台 进 
程 的 运行 频率 将 会 比较 低下 并 且 运 行 时 间 较 为 短暂 。 有 关 后 台 (background) 操作 是 当 没有 
高 优先 级 进程 处 于 就 绪 状 态 的 情况 下 所 执行 的 琐事 。 也 就 是 说 ， 在 后 台 任 务 中 所 执行 的 指令 
不 会 以 牺牲 任何 用 户 进程 为 代价 来 加 以 执行 ， 因 此 这 些 指令 或 多 或 少 是 免费 的 或 者 说 是 没有 
开销 的 。 

值得 注意 的 是 ， 淘 汰 一 个 脏 页 的 代价 是 淘汰 只 读 页 面 或 干净 页 面 的 代价 的 两 倍 。 这 是 因 
为 其 间 操作 系统 必须 对 磁盘 进行 两 次 访问 ， 而 磁盘 访问 大 约 比 主 存 访 问 慢 1 一 10 000 倍 。 因 
此 ， 我 们 可 以 承受 消耗 大 量 的 处 理 器 周期 以 试图 找 出 在 当时 所 知 相关 信息 的 前 提 条 件 下 可 淘 
汰 的 “最 佳 ”页 面 。 我 们 可 以 看 到 ， 此 类 以 耗费 处 理 资源 来 节省 输入 /输出 的 一 种 方法 是 通 
过 结合 使 用 脏 位 (又 称 为 修改 位 ) 与 引用 位 来 改进 二 次 机 会 算法 。 这 种 算法 有 时 称 为 增强 型 
二 次 机 会 算法 (enhanced second chance algorithm， 又 称 为 改进 型 时 钟 算法 )， 有 时 也 称 为 最 
近 未 使 用 (Not Recently Used，NRU; 或 者 Not Used Recently，NUR ) 算法 。 在 这 种 算法 里 ， 
我 们 根据 这 两 位 的 设置 把 相关 页 面 划 分 为 4 种 类 型 : 1 ) 干净 且 未 引用 的 页 面 ; 2 ) 脏 的 但 
未 引用 的 页 面 (引用 位 在 对 应 页 面 被 修改 之 后 的 某 个 时 间 被 清 零 ); 3 ) 干净 但 引用 的 页 面 ; 
4 ) 脏 的 且 引 用 的 页 面 。 具体 而 言 ， 我 们 首先 顺 次 查看 页 表 的 相关 表 项 ， 以 查找 第 一 种 类 型 
的 页 面 ， 即 未 引用 且 干 净 的 页 面 。 如 果 找 到 此 类 页 面 ， 我 们 可 以 立即 使 用 。 而 如 果 我 们 没有 
找到 第 一 种 类 型 的 任何 页 面 ， 那么 我 们 将 再 次 查看 页 表 的 相关 表 项 ， 以 查找 第 二 种 类 型 的 页 
面 ， 以 此 类 推 。 直 到 第 四 轮 查 找 ， 我 们 保证 可 以 找到 某 个 页 面 作为 要 淘汰 的 页 面 ， 不 过 我 们 
常常 在 此 之 前 便 会 找到 一 个 更 好 的 淘汰 页 面 。 

在 请 求 分 页 系统 中 还 会 出 现 的 男 一 个 问题 是 ， 操 作 系 统 应 当 如 何 选择 进程 ， 以 从 中 提 
取 和 欲 淘汰 的 页 面 。 存 在 两 种 可 能 ， 其 一 是 操作 系统 只 能 从 引发 故障 的 进程 内 部 选择 页 面 (局 
部 置换 )， 其 二 是 操作 系统 可 以 从 任何 进程 那里 选择 页 面 (全 局 置换 )。 我 们 经 常 希望 程序 设 
计 人 员 所 编写 的 程序 使 用 的 资源 最 少 。 而 如 果 程 序 设计 人 员 编 写 的 程序 所 产生 的 页 面 故 障 较 
少 ， 那 么 他 的 程序 应 该 会 运行 得 更 快 。 采 用 局 部 置换 策略 ， 一 道 表 现 糟糕 的 程序 最 多 也 就 伤 
及 其 自身 。 而 使 用 全 局 置换 策略 ， 一 道 写 得 不 好 的 程序 可 能 会 拥有 一 个 过 大 的 工作 空间 ， 故 
而 会 伤害 到 其 他 进程 ， 进 而 产生 特别 多 的 页 面 故 障 。 其 结果 是 ， 一 道 精心 设计 且 所 产生 页 面 
故障 较 少 的 程序 可 能 会 受到 另 一 道 设计 不 太 精 良 且 所 产生 页 面 故 障 较 多 的 程序 的 不 利 影响 。 
通过 设立 一 个 后 台 进 程 来 运行 二 次 机 会 算法 以 识别 可 疑 页 面 ， 通 常 可 以 和 全 局 置换 策略 协同 
工作 且 效 果 良 好 。 一 般 来 说 ，UNIX 和 相关 系统 往往 采用 全 局 置换 策略 ， 而 Windows NT 系 
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列 操作 系统 则 常常 采用 局 部 置换 策略 。 

鉴于 内 存 和 硬盘 的 动态 特性 ， 页 面 置 换算 法 目前 仍 是 一 个 有 大 量 的 研究 正在 开展 的 活跃 
领域 。 伴 随 相 关 尺寸 、 速 度 和 成 本 的 变化 ， 折 中 权衡 亦 在 发 生 着 变化 ， 不 同 的 算法 往往 可 能 
适用 于 不 同 的 情况 和 具有 较 好 的 效用 。 


11.5.5 每 个 进程 应 当 拥 有 多 少 页 面 


当 一 个 操作 系统 按 请 求 分 页 方式 进行 设计 时 ， 我 们 并 不 会 让 有 关 程 序 在 内 存 中 无 限 地 增 
长 。 一 方面 ， 正 如 我 们 在 讨论 工作 集 的 概念 时 所 看 到 的 ， 最 终 在 内 存 中 将 会 有 一 些 相应 程序 
不 再 引用 的 页 面 。 同 时 还 有 一 些 其 他 的 页 面 ， 在 一 段 时 间 不 会 需要 ， 但 是 我 们 现在 可 以 让 另 
一 个 进程 更 有 成 效 地 来 使 用 这 些 内 存 ， 而 当 我 们 需要 那些 页 面 时 再 重新 加 载 它 们 。 为 此 ， 便 
出 现 了 每 个 进程 应 该 允许 使 用 多 少 页 面 的 问题 。 通 常 可 以 使 用 各 种 不 同 的 方案 来 设置 此 类 限 
值 。 首 先 ， 存 在 某 个 最 低 限 值 设 定 ， 即 我 们 不 希望 一 个 程序 的 页 面 数 降 至 该 限 值 以 下 。 例 
如 ， 在 一 些 机 器 上 常见 的 指令 类 型 是 内 存 到 内 存 的 操作 。 就 这 种 情况 而 言 ， 对 应 指令 本 身 
可 能 会 跨越 页 面 边界 ， 故 而 我 们 需要 两 个 页 面 来 访问 相应 的 指令 。 同 时 ， 源 操作 数 (source 
operand) 和 目标 操作 数 (target operand) 也 都 可 能 跨越 页 面 边界 ， 因 而 对 于 单个 进程 来 讲 ， 
在 这 种 类 型 的 机 器 上 存在 6 个 页 面 的 绝对 下 限 。 即 使 是 有 这 样 的 设 定 ， 一 个 程序 却 往往 可 能 
拥有 一 个 比 此 绝对 下 限 值 要 大 的 工作 集 。 但 是 ,什么 才 是 一 个 合理 的 上 限 呢 ? 

我 们 可 以 在 一 个 原型 系统 上 研究 程序 的 运行 ， 并 随意 设置 某 个 限 值 。 但 是 ， 如 果 没有 足 
够 多 的 进程 正在 运行 并 且 相 应 页 面 并 未 填 满 所 有 可 用 的 内 存 ， 那 么 我 们 将 会 产生 一 些 我 们 本 
来 不 必要 产生 的 页 面 故 障 。 因 此 ， 随 意 设置 限 值 并 不 是 一 个 很 好 的 主意 。 我 们 可 以 让 系统 稍 
微 有 点 动态 适应 的 味道 ， 也 就 是 说 ， 可 以 简单 地 通过 将 可 用 页 面 总 数 除 以 正在 运行 的 进程 数 
来 实施 相关 分 配 。 这 种 机 制 被 称 为 公平 分 配 (equal allocation ， 或 称 为 平均 分 配 )。 不 过 ， 这 
种 方案 通常 也 并 不 合理 。 进 一 步 说 ， 如 果 其 中 一 个 进程 是 基于 图 形 化 用 户 界面 的 计算 器 而 另 
一 个 进程 是 万 维 网 服务 器 ， 那 么 我 们 可 能 会 合理 地 推断 出 网 站 服务 器 应 当 可 以 使 用 额外 的 
页 面 以 便 获得 更 大 的 效益 。 比 较 程序 的 大 小 是 猜测 哪些 程序 可 以 使 用 更 多 页 面 的 一 种 简单 
方法 。 从 磁盘 空间 占用 情况 来 看 ， 网 站 服务 器 程序 可 能 会 比 计算 器 程序 大 100 倍 ， 因 此 按 
100 : 1 的 方式 来 进行 网 站 服务 器 和 计算 器 的 页 面 分 配 应 当 是 合理 的 。 这 种 机 制 被 称 为 按 比 
例 分 配 ( proportional allocation)。 不 过 ， 这 仍然 算 不 上 是 一 种 完美 的 解决 方案 。 考 虑 可 能 打 
开 一 个 小 的 备忘录 文件 亦 或 打开 一 整 本 书 的 字 处 理 程 序 。 显 然 ， 打 开 整 本 书 应 当 比 打开 一 个 
小 的 备忘录 文件 更 可 能 有 效 地 利用 较 多 的 页 面 。 我 们 真正 想 要 做 的 应 当 是 拥有 某 种 机 制 ， 按 
照 进程 对 页 面 使 用 的 比例 来 进行 页 面 的 分 配 。 


11.5.6 ”页 面 限 值 自动 平衡 


大 多 数 现代 的 操作 系统 常常 会 使 用 页 面 限 值 自动 平衡 这 样 的 机 制 ， 且 大 多 数 相关 机 制 是 
建立 在 页 面 故 障 频率 ( Page Fault Frequency，PFF) 算法 基础 上 的 变种 。 一 般 来 讲 ， 它 们 依 
赖 于 这 样 的 思想 ， 也 就 是 说 ， 一 个 进程 的 缺 页 率 (或 称 为 页 面 故障 率 ) 是 对 应 进程 是 否 拥有 
适当 页 数 的 一 种 很 好 的 指标 。 如 果 相 应 进程 拥有 的 页 面 太 少 ， 那 么 缺 页 率 将 会 快速 上 升 。 而 
如 果 一 个 进程 不 产生 任何 页 面 故障 ， 那 么 该 进程 也 可 能 拥有 内 存 中 的 一 些 页 面 但 其 并 不 需 
要 。 为 此 ， 相 关机 制 设 定 了 关于 缺 页 率 的 一 个 上 限 和 一 个 下 限 。 图 11-13 显示 了 这 种 机 制 的 
工作 机 理 。 如 果 一 个 进程 的 缺 页 率 低 于 对 应 下 限 值 ， 那 么 操作 系统 应 当 从 该 进程 的 最 大 页 杠 
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计数 值 中 减 去 1。 如 果 缺 页 率 超 过 了 对 应 的 上 限 值 ， 那 么 操作 系统 应 当 对 该 进程 的 最 大 页 杠 
计数 值 加 1。 这 种 机 制 将 倾向 于 保持 系统 中 的 所 有 进程 在 同样 缺 页 率 的 情形 下 运行 ， 并 且 将 
会 向 一 个 进程 分 配 其 需要 保持 在 相应 范围 的 尽 可 能 多 的 页 框 。 


| 
最 大 值 | 低 于 缺 页 率 最 低 
| 限 值 一 移 除 页 框 
1 | 
人 | | 
分 配 的 | | | 
页 框 数 | | “\、 | ! 
对 缺 页 率 
NS | 高 于 缺 页 率 最 高 
| | 





0 ， 页 面 故障 频率 1 最 大 值 





图 11-13 页 面 限 值 自动 平衡 


11.5.7 “抖动 


假设 现在 我 们 针对 一 个 进程 可 以 使 用 的 页 数 设置 了 一 个 硬 上 限 一 一 不 妨 称 之 为 限 值 N。 
进一步 假设 ， 这 个 进程 的 设计 是 这 样 的 ， 也 就 是 说 该 进程 已 经 到 达 其 执行 的 某 一 阶段 且 其 工 
作 集 超过 了 NN 页 的 上 限 。 最 后 假设 我 们 仅仅 使 用 了 局 部 页 面 置 换 策略 ， 故 而 当 有 关 进 程 产 
生 一 个 页 面 故障 时 ， 我 们 将 会 把 该 进程 已 经 映射 的 一 个 页 面 淘汰 掉 以 进行 置换 。 于 是 ， 这 一 
进程 将 会 不 断 地 产生 新 的 页 面 故障 ， 并 将 其 大 部 分 时 间 都 花费 在 等 待 磁盘 输入 /输出 操作 方 
面 。 其 结果 是 ， 该 进程 完成 的 实际 工作 很 少 ， 而 系统 还 会 遭受 到 过 多 的 磁盘 输入 /输出 操作 
压力 。 这 种 现象 被 称 为 抖动 (thrashing， 或 称 为 颠 复 )。 在 这 个 例子 里 ， 只 有 唯一 的 一 个 进 
程 发 生 了 抖动 。 需 要 指出 的 是 ， 拌 动 并 不 取决 于 我 们 在 这 里 设想 的 那些 限制 条 件 。 如 果 所 有 
正在 运行 的 进程 的 工作 集 的 总 和 大 于 实际 的 主 存 ， 那 么 整个 系统 将 会 花费 较 多 的 时 间 来 进行 
页 面 的 淘汰 和 替换 ， 而 不 是 把 有 效 的 时 间 花 在 运行 进程 方面 ， 这 时 我 们 会 说 整个 系统 发 生 了 
抖动 。 一 旦 发 生 了 抖动 ， 则 往往 很 难 停 下 来 ， 因 为 恰恰 是 那些 用 来 终止 某 些 可 能 并 非 必要 的 
进程 的 执行 操作 行为 本 身 ， 将 会 把 更 多 的 代码 加 载 到 内 存 ， 并 实际 上 可 能 会 使 情况 变 得 更 为 
糟糕 。 


11.5.8 页面 锁定 


主 存 通 常会 用 作 输 入 和 输出 操作 的 缓冲 区 。 如 果 一 个 缓冲 区 页 面 存在 尚未 完成 的 输入 / 
输出 操作 ,那么 该 页 面 有 可 能 当前 未 被 应 用 程序 修改 ， 故 而 可 能 最 终 会 被 分 页 机 制 选择 来 重 
新 使 用 一 一 这 显然 会 带 来 灾难 性 的 结果 。 为 了 防止 这 种 不 幸 的 事件 ， 支 持 请 求 分 页 的 操作 系 
统 必须 允许 一 个 应 用 程序 (往往 是 设备 驱动 程序 ) 锁定 ( lock) 一 个 页 面 ， 以 便 分 页 机 制 不 
会 选择 对 应 页 面 。 以 下 是 源 自 POSIX 规范 的 关于 这 些 功能 的 典型 的 函数 原型 : 


int mlock (const void ‘addr, size t len) 
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该 例 程 请 求 操作 系统 锁定 来 自主 调 进程 逻辑 地 址 空间 的 指定 范围 的 页 面 。 要 锁定 的 页 面 
范围 从 地 址 addr 开始 且 大 小 为 len 字 节 。 只 有 完整 的 页 面 才能 够 被 锁定 ， 故 而 该 范围 实际 上 
包括 了 任何 包含 指定 地 址 范围 的 任何 部 分 的 页 面 。 如 果 该 函数 成 功 返 回 ， 那 么 每 个 页 面 都 会 
绑 定 到 一 个 物理 页 框 上 ， 并 标记 为 保持 这 种 方式 。 这 意味 着 ， 如 果 对 应 范围 中 的 某 些 页 面 当 
前 尚未 加 载 到 内 存 和 驻 留 下 来 那么 对 该 函数 的 调用 可 能 会 导致 相应 页 面 的 调 人 ， 并 且 该 函 
数 将 会 阻塞 和 等 待 相关 调和 人 操作 的 完成 。 同 时 ， 如 果 该 函数 成 功 结束 ， 返 回 值 为 零 。 否 则 ， 
返回 值 为 -1， 并 且 全 局 变量 errno 被 赋予 了 相应 的 取 值 。 


int munlock (const void "addr，size t len) 


munlock 例 程 则 请 求 操 作 系统 解锁 主 调 进 程 的 指定 范围 的 页 面 。 本 例 程 与 mlock 的 功能 刚好 
相反 。 


11.5.9 ”页面 清理 机 制 


如 前 所 述 ， 选 用 一 个 干净 的 页 面 而 不 是 脏 页 面 予 以 淘汰 和 进行 替换 是 非常 重要 的 。 这 样 
就 无 须 把 脏 页 面 写 入 对 换文 件 。 进 一 步 说 ， 由 于 磁盘 要 比 主 存 慢 1 一 10 000 倍 ， 所 以 我 们 可 
以 花费 很 多 指令 来 试图 避免 一 次 磁盘 输入 /输出 操作 。 男 一 方面 ， 我 们 可 以 尽量 在 后 台 完 成 
一 些 磁盘 操作 ， 而 不 是 在 我 们 等 待 一 个 页 面 被 加 载 的 时 候 来 做 磁盘 操作 。 

我 们 可 以 通过 保持 一 个 干净 的 空闲 页 框 池 的 可 用 性 来 减少 使 用 脏 页 面 所 带 来 的 影响 。 当 
页 面 淘 汰 算法 选择 一 个 脏 页 面 作为 替换 的 牺牲 品 ( 即 淘汰 页 ) 时 ， 操 作 系统 就 可 以 使 用 来 自 
空闲 页 框 池 的 一 个 干净 的 页 框 。 然 后 ， 在 后 台 将 脏 页 的 内 容 写 到 磁盘 上 。 而 当 脏 页 变 得 干净 
的 情况 下 ， 则 可 以 把 相应 的 页 框 放 到 空闲 页 框 池 中 。 

可 以 在 后 台 完 成 的 另 一 项 任务 是 清理 脏 页 。 具 体 而 言 ， 可 以 设立 一 项 后 台 任 务 来 查找 最 
近 未 被 引用 的 页 面 (故而 可 能 会 作为 候选 的 淘汰 页 面 ) 并 且 是 脏 的 页 面 。 同 时 针对 这 些 页 面 
启动 执行 一 项 后 台 写 操作 任务 ， 从 而 使 将 来 选择 这 些 页 面 作 为 淘汰 页 面 进行 替换 时 ， 它 们 是 
干净 的 。 当 然 ， 有 关 页 面 可 能 会 在 对 应 进程 运行 时 再 次 变 脏 ， 但 是 我 们 是 在 后 台 以 最 低 优 先 
级 来 完成 此 项 工作 的 ， 因 此 ， 我 们 不 会 浪费 可 能 要 做 其 他 事情 的 输入 /输出 周期 或 处 理 器 周 
期 。 换 名 话说， 我 们 往往 利用 的 是 无 其 他 正事 可 做 的 输入 /输出 周期 或 处 理 器 周期 来 完成 此 
类 后 台 任务 。 


11.5.10 ”程序 设计 与 缺 页 率 


一 般 来 讲 ， 我 们 认为 虚拟 内 存 和 请 求 调 页 (或 称 为 请 求 分 页 ) 对 于 应 用 程序 来 说 是 透明 
的 。 但 是 ,确实 存在 关于 程序 设计 如 何 影响 缺 页 率 的 一 些 评论 。 例 如 ， 考 虑 一 张 比较 大 的 表 
的 搜索 问题 。 假 设 相 应 表 足 够 大 ， 以 至 于 会 跨越 多 个 页 面 ， 并 且 该 表 将 被 多 次 搜索 以 查找 不 
同 的 项 。 采 用 二 分 搜索 ,我 们 将 在 每 次 开始 搜索 时 碰 上 中 间 的 页 面 。 然 后 ， 我 们 将 可 能 会 碰 
到 另外 的 两 个 页 面 中 的 一 个 页 面 ， 或 者 在 前 半 部 分 ， 或 者 在 后 半 部 分 。 于 是 ， 这 三 个 页 面 至 
少 可 能 会 在 大 部 分 的 时 间 驻 留 在 内 存 中 ， 这 样 我 们 在 这 些 页 面 上 就 很 少 会 出 现 页 面 故障 〈 即 
缺 页 问题 )。 然 而 ， 对 于 散 列 表 搜 索 而 言 ， 几 乎 每 次 查找 都 会 导致 不 同 页 面 的 读 取 ， 因 为 散 
列表 (或 称 为 哈 希 表 ) 的 基本 目的 是 随机 地 寻 址 整个 表 ， 以 期 望 通过 第 一 次 引用 就 能 够 撞 上 
所 查找 的 表 项 。 因 此 ， 非 常 庞大 的 散 列表 往往 不 能 在 虚拟 内 存 系统 (或 称 为 虚拟 存储 系统 ) 
中 很 好 地 运作 。 
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接 下 来 ,考虑 执行 矩阵 乘法 的 某 个 程序 的 如 下 部 分 9 
for(i=0;i<500;i 二 十 ) 
for(j=0;j<500;j 十 十 ) 
for (Kk 三 0;Kk<500;k 十 十 ) 
x[i] (j=x[i] [j]+y([i] [Kk]*z[k] [j]; 
当 这 有 段 代码 在 配置 为 MIPS R4000 处 理 器 和 1MB 高 速 缓存 的 Silicon Graphics 系统 上 按 
双 精 度 浮 点 数 数组 运行 时 ， 其 运行 时 间 为 77.2 s。 
然而 ， 我 们 可 以 就 这 段 代 码 做 一 个 小 小 的 变动 ， 也 就 是 改变 循环 的 顺序 ， 使 最 内 层 的 循 
环 一 步 步 通过 同一 页 面 的 内 存 区 域 ， 如 下 所 示 : 
fo (=0;Kk<500; 十 十 ) 
for(j=0;j<500;j 十 十 ) 
for (i=0;i<500;i 十 十) 
x[i] [j]=x[i] [j]+y[i] [k]*z[k] [j]; 
上 面 第 一 个 例子 的 问题 在 于 ， 有 关 数 组 是 存放 在 内 存 中 的 ， 故 而 相 邻 行 的 元 素 (第 一 个 下 标 ) 
是 连续 的 。 但 由 于 其 控制 最 内 层 循环 的 变量 不 是 行 下 标 ， 所 以 每 次 引用 都 将 指向 不 同 的 页 


面 。 而 当 我 们 像 第 二 个 例子 那样 改变 相关 循环 后 ， 每 次 循环 都 将 引用 相同 的 页 面 ， 于 是 由 于 


页 面 故障 数量 〈 即 缺 页 次 数 ) 的 减少 ， 运 行 时 间 便 下 降 到 了 44.2 s。 

综 上 所 述 , 一 般 来 讲 ， 虚 拟 内 存 和 请 求 调 页 的 操作 对 于 应 用 程序 是 透明 的 ， 这 意味 着 程 
序 设计 人 员 无 须 太 多 地 关注 这 些 机 制 一 一 相应 代码 无 论 以 哪 一 种 格式 都 可 以 正确 地 工作 。 但 
正如 我 们 刚才 所 看 到 的 ， 这 并 不 意味 着 虚拟 内 存 和 请 求 调 页 的 相关 操作 在 任何 情况 下 都 不 会 
产生 影响 。 


11.6 ”特殊 的 内 存 管理 主题 
11.6.1 进程 间 内 存 共享 


分 段 和 分 页 都 允许 在 进程 之 间 共 享 部 分 的 内 存 空间 ， 而 且 这 可 以 大 量 地 节省 内 存 。 例 
如 ， 在 支持 多 用 户 的 大 型 机 上 ， 可 能 经 常会 见 到 许多 用 户 同 时 运行 一 个 字 处 理 程序 。 通 过 分 
页 机 制 ， 许 多 进程 的 页 表 可 以 都 指向 内 存 中 的 相同 页 框 ， 这 样 在 内 存 中 实际 上 只 驻 留 对 应 程 
序 代 码 的 一 个 副本 即 可 。 类 似 地 ， 通 过 分 段 机 制 ， 许 多 进程 的 段 表 可 以 都 指向 相同 的 物理 内 
存 分 段 而 达到 同样 的 目的 。 虽 然 这 样 非 常 方便 ， 但 也 可 能 会 带 来 一 些 问题 。 进 一 步 说 ， 如 果 
被 共享 的 内 存 部 分 是 数据 分 段 ， 那 么 各 个 进程 将 会 更 改 某 些 页 面 。 而 这 在 某 些 情况 下 可 能 确 
实 期 望 如 此 ， 但 也 可 能 在 另外 一 些 情况 下 并 非 所 愿 。 若 干 进 程 可 能 会 使 用 共享 内 存在 它们 之 
间 进 行 通信 。 在 这 种 情况 下 ， 我 们 希望 每 个 进程 都 能 够 看 到 对 页 面 的 所 有 更 改 ， 因 此 有 关 进 
程 应 该 查看 物理 内 存 中 的 相同 页 框 。 但 是 ,考虑 一 下 进程 创建 子 进程 的 情形 。 一 开始 ， 理 想 
的 状况 应 当 是 在 两 个 进程 之 间 共 享 整个 物理 地 址 空间 。 但 是 ， 当 这 两 个 进程 运行 时 ， 一 个 进 
程 所 做 的 更 改 却 往往 不 应 该 被 其 他 的 进程 所 看 到 。 为 了 满足 这 种 现实 需求 ， 操 作 系 统 可 以 使 
用 一 种 被 称 为 写 时 复制 ( copy on write， 或 称 为 写 时 拷贝 ) 的 机 制 。 于 是 ,一 开始 ， 这 两 个 
进程 将 被 映射 到 相同 的 物理 页 框 上 ,但 相应 的 页 表 (或 段 表 ) 的 表 项 将 被 设置 为 只 读 模式 。 
如 果 其 中 有 任 一 进程 试图 写 操作 这 部 分 共享 内 存 ， 那 么 就 会 发 生 一 个 中 断 。 而 当 这 种 情况 发 


日 Patterson, David A. and John L. Hennessy, Computer Organization and Design: The Hardware/Software Interface, 
Morgan Kaufmann, 2004, p. 617. 
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生 时 ， 内 存 管理 子 系统 将 为 每 个 进程 分 别 创建 共享 内 存 部 分 的 单独 副本 ,并 从 对 应 的 表 项 中 
移 除 写 保护 标志 ， 同 时 调整 为 每 个 进程 只 能 允许 查看 其 自身 版 本 的 数据 。 

Solaris 系统 支持 使 用 shmget() 例 程 来 访问 共享 内 存 块 (Solaris 称 之 为 分 段 ) 。 一 个 进程 
可 以 通过 该 例 程 的 第 一 次 调用 来 创建 一 个 共享 块 ， 而 该 共享 块 则 由 具有 指向 一 片 物理 内 存 区 
域 的 唯一 标识 符 的 控制 结构 来 加 以 描述 。 该 共享 块 的 标识 符 一 般 称 为 共享 内 存 标识 符 ( 简 记 
作 shmid)。 

下 面 是 Solaris 系统 用 于 访问 共享 内 存 块 的 调用 说 明 : 


int shmget (key t key, size t size, int shmflg); 


参数 key 或 者 是 key t 类 型 的 一 个 变量 , 或 者 是 常量 宏 IPC_PRIVATE。 它 是 用 来 赋值 给 
所 返回 的 共享 内 存 块 的 数值 键 值 。 参 数 size 是 所 请 求 的 块 的 大 小 (以 字 节 为 单位 )。 参 数 
shmflg 用 来 指定 初始 的 访问 权限 和 创建 时 的 控制 标志 。 

如 果 相 关 调用 成 功 ， 它 将 返回 一 个 用 来 标识 共享 内 存 块 的 标识 符 。 另 外 ， 调用 也 可 
用 于 获取 由 另 一 进程 创建 的 已 有 共享 块 的 标识 符 。 

以 下 代码 举例 说 明了 shmget() 的 基本 用 法 : 


key t key; /* 用 作 传 递 给 函数 shmget () 的 键 值 的 参数 */ 

int shmflg; /* 用 作 传递 给 函数 shmget () 的 初始 访问 权限 和 创建 时 控制 标志 的 参数 */ 
int shmid; /* 用 于 接收 函数 shmget () 的 返回 值 */ 

int size; /* 用 作 传递 给 函数 shmget () 的 块 大 小 的 参数 */ 


shm id = shmget(IPC PRIVATE, size, shmfl1g); 
if (shm id<0) { 

printf(“shmget error\n’”); 

exit(1); 


} 
服务 器 和 客户 端 可 以 采用 fork 调用 的 方式 进行 创建 ,也 可 以 互 不 相关 。 对 于 子 进程 而 言 ， 如 
果 一 个 共享 内 存 块 是 在 创建 相应 子 进程 之 前 请 求 和 附着 上 去 的 ， 那 么 服务 器 可 能 想 使 用 IPC_ 
PRIVATE， 因 为 对 应 子 进程 拥有 服务 器 的 地 址 空间 的 副本 ， 其 中 就 包含 有 所 附着 的 共享 块 。 
但 是 ， 如 果 服 务 器 和 客户 端 是 相对 独立 的 进程 ， 那 么 使 用 IPC_PRIVATE 并 不 是 一 种 好 的 方 
案 ， 因 为 客户 端 并 不 知道 对 应 的 键 值 。 


11.6.2 ”内 存 映 射 文件 


大 多 数 的 现代 操作 系统 都 支持 一 种 特殊 的 称 为 内 存 映 射 文件 ( memory mapped file) 的 
内 存 共享 模式 。 在 这 种 模式 中 ， 一 个 进程 可 以 请 求 操 作 系统 打开 一 个 文件 并 将 该 文件 中 的 全 
部 或 部 分 数据 与 该 进程 的 逻辑 地 址 空间 的 某 个 区 域 相关 联 。 然 后 ， 该 进程 就 可 以 将 对 应 空间 
区 域 中 的 信息 作为 数组 或 通过 内 存 指 针 来 进行 引用 。 这 种 系统 具有 两 个 主要 的 优点 。 第 一 个 
优点 是 相应 进程 不 必 使 用 输入 /输出 语句 来 访问 有 关 数 据 一 一 请 求 分 页 系统 负责 访问 对 应 文 
件 来 存 取 合适 的 数据 。 第 二 个 优点 是 两 个 或 多 个 进程 可 以 同时 请 求 操作 系统 访问 同一 个 文 
件 。 相 同 的 内 存 页 框 将 被 映射 到 相应 两 个 或 多 个 进程 的 逻辑 地 址 空间 中 ， 支 持 它们 对 内 存 的 
共享 访问 。 因 此 ， 这 种 机 制 为 两 个 或 多 个 进程 之 间 的 数据 共享 提供 了 一 种 较为 简单 的 机 制 。 
当然 ， 相 关 进 程 可 能 需要 使 用 同步 技术 来 避免 彼此 之 间 的 干扰 。 另 外 ， 如 果 “ 共 享 文件 ”的 
真实 目的 是 在 两 个 或 多 个 进程 之 间 提 供 一 个 共享 内 存 区 域 ， 那 么 相应 的 共享 文件 实际 上 并 不 
需要 作为 一 个 文件 而 驻 留 在 文件 系统 上 。 

举例 来 说 ， 下 面 是 关于 如 何在 Windows 操作 系统 的 Win32 库 例 程 支持 下 来 创建 内 存 映 
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射 对 象 (包括 文件 ) 的 说 明 : 


HANDLE WINAPI CreateFileMappingl( 
_in HANDLE hrFile, 
_in opt LPSECURITY ATTRIBUTES lpAttributes, 
__in DWORD flProtect, 
_in DWORD dwMaximumSizeHigh, 
_in DWORD dwMaximumSizeLow, 
_in opt LPCTSTR lpName 
); 


相应 参数 的 具体 含义 如 下 : 

e hFile 一 一 一 个 指向 用 来 创建 映射 对 象 的 文件 的 句柄 。 如 果 hFile 为 -1， 那 么 对 应 调 
用 还 必须 通过 参数 dwMaximumSizeHigh 和 dwMaximumSizeLow 来 指定 有 关上 映射 对 
象 的 大 小 ， 同 时 在 系统 页 面 文件 中 创建 一 个 临时 文件 ， 而 不 是 建立 到 文件 系统 的 一 
个 文件 的 映射 。 





一 个 指向 相应 映射 对 象 的 包含 有 访问 控制 表 ( Access Control List， 
ACL) 和 其 他 安全 信息 的 安全 描述 符 结构 的 指针 。 

flProtect 用 来 保护 相应 映射 对 象 ， 可 具体 取 值 为 如 下 常量 : 

四 PAGE_READONLY (以 只 读 方 式 打 开 映 射 对 象 ) 

回 PAGE _ READWRITE (以 可 读 、 可 写 方式 打开 映射 对 象 ) 

和 四 PAGE_WRITECOPY (以 写 时 复制 方式 打开 映射 对 象 ) 

曙 PAGE_EXECUTE_READ (以 可 执行 、 可 读 方 式 打开 映射 对 象 ) 

国 

国 

国 





PAGE_ EXECUTE _ READWRITE (以 可 执行 、 可 读 、 可 写 方 式 打开 映射 对 象 ) 
PAGE_EXECUTE_WRITECOPY (以 可 执行 、 写 时 复制 方式 打开 映射 对 象 ) 
等 等 。 


® dwMaximumSizeHigh 





用 来 指定 相应 映射 对 象 的 最 大 长 度 的 高 位 双 字 ， 即 高 32 位 。 
@ dwMaximumSizeLow 用 来 指定 相应 映射 对 象 的 最 大 长 度 的 低位 双 字 ， 即 低 32 位 。 
e lpName 一 一 用 来 指定 欲 映射 的 文件 的 名 称 。 


11.6.3 ”Windows XP 预 提 取 文 件 


为 了 优化 请 求 分 页 的 使 用 ， 各 种 操作 系统 均 已 开发 了 一 些 很 有 意思 的 技术 。 其 中 ,在 
Windows XP 中 所 使 用 的 一 种 有 趣 的 技术 被 设计 成 是 用 来 提高 程序 加 载 和 初始 化 的 速度 。 其 
基本 想法 是 ， 当 一 个 程序 被 加 载 时 ， 每 次 总 会 执行 相同 的 指令 序列 。 因 此 ， 这 一 过 程 总 会 产 
生 相 同 的 页 面 故 障 序列 即 缺 页 序列 。 同 时 ， 这 项 技术 倾向 于 成 群 地 产生 这 些 页 面 故障 。 例 
如 ， 当 有 关 代码 执行 时 ， 该 项 技术 将 会 触发 提取 相应 代码 的 连续 页 面 序列 。 鉴 于 其 间 会 牵涉 
对 其 他 页 面 中 的 子 程序 的 调用 和 数据 的 引用 ， 所 以 在 这 一 过 程 中 还 会 产生 其 他 的 页 面 故障 。 
最 终 ， 有 关 磁 盘 驱 动 器 就 获得 了 以 随机 顺序 来 回 查找 和 提取 相关 页 面 的 训练 机 会 。XP (以 及 
某 些 其 他 的 操作 系统 ) 采用 了 一 种 更 好 的 技术 。 当 一 道 程序 第 一 次 启动 的 时 候 ， 有 关 操 作 系 
统 将 会 监测 记录 该 程序 在 前 几 分 钟 内 所 产生 的 所 有 页 面 故 障 ， 并 将 这 些 页 面 故障 记录 在 称 为 
预 提取 (prefetch) 文件 类 型 的 一 个 文件 中 。 接 下 来 ， 有 关 操 作 系 统 将 会 在 后 台 对 该 文件 进行 
排序 处 理 。 这 样 ， 当 以 后 对 应 程序 启动 的 时 候 ， 操 作 系统 便 可 以 提取 那些 在 程序 初始 化 时 所 
使 用 的 所 有 代码 页 。 系 统 可 以 通过 几 个 规模 比较 大 的 读 取 操 作 来 提取 对 应 主 程序 所 需要 的 所 
有 页 面 。 然 后 ， 系 统 将 会 移动 到 磁盘 上 的 另 一 个 地 方 来 提取 所 有 的 子 程序 代码 ， 其 后 再 移动 
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到 另外 的 一 个 地 方 来 提取 将 要 使 用 的 那些 数据 页 ， 等 等 。 这 种 技术 将 会 减少 大 量 的 缺 页 中 断 
次 数 。 同 时 ， 由 于 利用 一 次 操作 方式 来 完成 较 大 磁盘 存储 块 的 读 取 ， 所 以 这 种 技术 还 极 大 地 
减少 了 磁头 移动 和 旋转 延迟 等 相关 开销 。 


11.6.4 Symbian 内 存 管理 


Symbian 操作 系统 是 为 在 手机 (cell phone， 也 称 为 移动 电话 ) 平台 上 使 用 而 创建 的 。 
种 操作 系统 以 一 种 独特 的 方式 来 利用 现代 处 理 器 中 的 有 关 分 页 硬件 。 i 
在 手机 中 ， 往 往 假定 没有 辅助 存储 器 ， 也 就 是 说 没有 磁盘 驱动 器 。 正 如 第 4 章 中 针对 Palm 
操作 系统 所 讨论 的 那样 ， 存 储 在 手机 中 的 所 有 程序 总 是 存放 在 主 存 中 。 因 此 ， 与 大 多 数 系统 
相 比 ， 其 主 存 更 加 稀缺 ， 特 别 是 考虑 到 在 手机 上 需要 保持 低 功 耗 规格 的 情况 下 。 另 一 方面 ， 
在 手机 上 所 使 用 的 处 理 器 架构 包含 有 分 页 硬件 ， 而 大 多 数 的 系统 环境 包含 有 辅助 存储 器 。 同 
时 ， 在 大 多 数 的 操作 系统 中 ， 内 存 管理 硬件 应 该 完成 的 三 项 功能 包括 : 1 ) 程序 的 动态 重 定 
位 ; 2 ) 对 给 定 程序 的 保留 空间 的 寻 址 的 限制 ; 3 ) 允许 从 辅助 存储 器 随机 动态 加 载 任何 页 面 
到 主 存储 器 中 。 在 Symbian 操作 系统 中 ， 并 不 需要 动态 加 载 功 能 。 此 外 ， 为 每 个 程序 存储 
页 表 将 会 占用 宝贵 的 内 存 。 因 此 ，Symbian 开发 人 员 面 临 的 问题 就 是 如 何 最 有 效 地 利用 硬件 
来 完成 其 余 的 两 项 工作 。Symbian 操作 系统 开发 人 员 所 采用 的 解决 方案 是 ， 为 系统 中 的 所 有 
进程 使 用 唯一 的 一 张 页 表 。 
当 需 要 上 下 文 改变 并 且 某 一 程序 即将 进入 运行 状态 时 ， 该 单一 页 表 就 需要 进行 修改 。 
图 11-14 举例 说 明了 相关 修改 的 基本 做 法 。 在 图 11-14a 中 ,我们 可 以 看 到 当 进程 B 正在 运 
行 时 的 页 表 。 该 页 表 拥 有 从 进程 A、 进程 B 以 及 它们 各 自 的 线程 数据 页 到 相应 的 页 框 的 普 
通 的 映射 。 同 时 ,该 页 表 还 预 留 有 一 节 ， 始 终 用 来 指向 当前 正在 执行 的 进程 的 页 框 。 在 应 该 
进行 上 下 文 切换 和 开始 执行 进程 A 的 时 候 ， 操 作 系 统 将 把 进程 A 的 相关 页 表 项 复制 到 为 当前 
运行 进程 所 预 留 的 那 部 分 页 表 项 中 ,具体 在 图 11-14b 中 进行 了 例 示 。 其 中 ,我 们 看 到 页 表 已 
经 更 新 为 运行 进程 A 时 的 情形 。 这 种 做 法 的 结果 就 是 ， 当 前 运行 进程 的 页 框 的 指针 总 是 会 出 
现在 页 表 中 的 两 个 位 置 ， 一 处 是 其 实际 驻 留 的 地 方 ， 另 一 处 是 作为 正在 运行 进程 所 对 应 的 相 
关 部 分 。 这 便 允 许 有 关 分 页 硬件 能 够 支持 简化 代码 生成 所 需 的 动态 重 定位 功能 ， 同 时 在 无 须 
为 每 个 进程 配备 一 个 页 表 而 消耗 额外 内 存 的 情况 下 限制 对 应 程序 只 能 访问 其 自身 的 内 存 区 域 。 


物理 地 址 空间 物理 地 址 空间 
逻辑 地 址 空间 (页 框 号 ) 逻辑 地 址 空间 (页 框 号 ) 
i 


总 是 映射 到 这 些 


当前 运行 进程 | 线程 A2 的 数据 
页 表 项 上 。 





a) 进 程 B 正 在 运行 b) 进 程 A 正在 运行 
图 11-14 Symbian 内 存 页 表 
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44.7 ”处 结 

在 本 章 中 ,我 们 通过 分 页 和 分 段 系 统 及 其 硬件 要 求 ， 还 有 分 段 和 分 页 的 结合 等 方面 讨论 
了 内 存 管 理 的 相关 设计 。 接 下 来 ,我 们 讨论 了 请 求 分 页 内 存 管理 。 我 们 分 析 了 请 求 分 页 的 效 
果 以 及 在 其 实现 中 所 出 现 的 一 些 问题 。 在 这 个 讨论 过 程 中 ， 我们 还 着 重 介绍 了 有 关 操 作 系 统 
技术 所 需 的 硬件 支持 。 另 外 ,我 们 还 用 一 节 的 内 容 围绕 高 级 内 存 管理 相关 的 一 些 主题 进行 了 
阐述 。 
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习题 

11.1 什么 样 的 硬件 开发 解决 了 外 部 碎片 的 问题 ? 

11.2” 当 有 关 分 页 硬件 将 逻辑 页 面 地 址 ( 即 页 号 ) 转换 为 物理 页 框 地 址 ( 即 页 框 号 ) 时 ， 相 应 地 址 中 的 
偏 移 地 址 部 分 会 发 生 什 么 ? 

11.3 当 我 们 第 一 次 就 通过 在 内 存 中 的 一 张 表 格 实现 内 存 引用 的 地 址 转换 方案 进行 评判 时 ， 其 中 对 有 
效 的 内 存 访 问 时 间 的 影响 是 什么 ? 而 我 们 就 此 采取 了 什么 样 的 措施 ? 

11.4 ”使 用 页 表 ， 我 们 需要 通过 某 种 方法 来 确定 相应 的 逻辑 地 址 空间 在 表 中 结束 的 位 置 。 我 们 讨论 了 
用 来 实现 这 一 目标 的 两 种 不 同 的 技术 。 PO A A 其 中 
的 一 种 技术 会 优 于 另 一 种 技术 ? 

11.5 最 终 ， 页 表 开 始 变 得 非常 庞大 和 稀 朴 。 什 么 技术 被 用 来 解决 这 个 问题 呢 ? 

11.6 分 页 之 外 的 另 王 种 方法 是 分 段 。 请 简要 阅 述 这 种 技术 。 

11.7 请 求 分 页 背后 的 基本 理念 是 什么 呢 ? 

11.8 ” 当 运 行 请 求 分 页 机 制 时 ， a 

11.9 什么 是 进程 的 “工作 集 ” 

11.10 相去 和 二 二 

11.11 当 发 生 缺 页 时 ， 为 什么 我 们 不 太 愿意 淘汰 脏 页 ? 

11.12 ”对 于 请 求 分 页 方式 而 言 ， 当 操作 系统 选择 要 淘汰 的 页 面 时 ， 局 部 置换 和 全 局 置换 之 间 的 区 别 是 
什么 ? 
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11.13 
11.14 
lk5 
11.16 


ka 
11.18 
11.19 
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如 何 确定 一 个 进程 运行 所 需 的 最 小 页 面 数 量 ? 

如 果 一 个 进程 频繁 地 发 生 抖 动 ， 那 么 该 进程 的 设计 人 员 应 该 如 何 改善 这 种 情况 呢 ? 

操作 系统 可 以 执行 什么 样 的 后 台 操作 来 提高 请 求 调 页 的 性 能 ? 

就 请 求 分 页 而 言 ， 散 列表 是 非常 差 的 执行 结构 。 但 是 我 们 也 曾 提 到 ， 二 分 搜索 却 可 能 相当 不 错 。 
还 有 哪些 其 他 基本 的 系统 结构 类 型 会 提供 非常 好 的 请 求 分 页 性 能 呢 ? 

Windows XP 中 设立 预 提 取 文 件 类 型 的 目的 是 什么 ? 

多 个 进程 是 如 何 使 用 内 存 映 射 文件 的 ? 

Symbian 操作 系统 以 一 种 非常 特殊 的 方式 来 使 用 分 页 存储 器 硬件 。 这 是 为 什么 呢 ? 


| 第 四 部 分 


Operating Systems: A Spiral Approach 


面 问 深 度 的 操作 系统 概念 的 展示 : 
文件 系统 和 输入 / 输出 





并 不 是 所 有 的 操作 系统 都 有 文件 系统 ， 但 是 ， 通 常 被 我 们 视 为 计算 机 的 任何 
设备 肯定 会 有 一 套 文件 系统 。 事 实 上 ， 许 多 不 被 我 们 看 作 计算 机 的 设备 ， 包 括 许 
多 游戏 系统 、 移 动 电话 、 音 乐 播放 器 和 掌上 电脑 等 ， 也 可 能 有 文件 系统 。 这 一 部 
分 将 涵盖 操作 系统 中 与 辅助 存储 器 管理 及 辅助 存储 器 上 所 见 到 的 文件 系统 相关 的 
一 些 内 容 。 

第 12 章 讨 论 了 典型 硬盘 驱动 器 的 布局 ,说 明了 文件 系统 所 拥有 的 基本 功能 。 
该 章 内 容 从 目录 概念 及 其 在 现代 文件 系统 中 的 设计 方案 出 发 ， 讨 论 了 文件 存 取 方 
法 (包括 顺序 存 取 、 随 机 存 取 和 索引 存 取 ) 的 基本 原理 ,介绍 了 文件 系统 中 的 空 
闲 空 间 的 监测 以 及 文件 自身 的 组 织 (或 分 配 )。 

第 13 章 首先 介绍 了 几 种 现代 的 文件 系统 ， 将 它们 作为 案例 研究 ， 具 体 说 明 
了 第 12 章 中 所 讨论 的 各 种 机 制 是 如 何 运 用 到 实际 的 操作 系统 的 。 该 章 内 容 涵盖 
那些 对 于 通常 的 应 用 不 那么 基础 但 却 在 现代 操作 系统 中 经 常见 到 的 高 级 的 文件 系 
统 功能 。 相 关 主 题 包 括 虚 拟 文件 系统 / 重 定向 、 内 存 映 射 式 文件 、 文 件 系 统 实用 
例 程 以 及 基于 日 志 的 文件 系统 。 

第 14 章 则 把 视野 转向 了 常常 独立 于 文件 系统 的 较 低 层级 ， 讨 论 了 在 各 种 操 
作 系 统 中 所 呈现 的 完整 的 输入 /输出 管理 子 系统 ， 介 绍 了 各 式 各 样 的 输入 /输出 
设备 ， 包 括 那 些 被 用 做 辅助 存储 器 的 输入 /输出 设备 。 该 章 内 容 之 所 以 纳入 这 一 部 
分 ， 是 因为 辅助 存储 器 的 管理 是 输入 /输出 子 系统 的 最 主要 的 应 用 。 输 入 /输出 下 
的 其 他 方面 则 被 单独 分 离 出 来 ， 放 到 如 关于 网 络 连接 的 章节 中 进行 说 明和 介绍 。 256 


第 12 章 | 


Operating Systems: A Spiral Approach 


文件 系统 基础 





文件 是 操作 系统 能 够 提供 的 最 重要 的 抽象 概念 之 一 。 文 件 概念 的 出 现 要 先 于 计算 机 ， 所 
以 文件 便 成 了 人 人 都 懂 的 说 辞 。 程 序 设计 人 员 并 不 想 在 磁盘 驱动 器 、 磁 带 或 者 其 他 任何 媒介 
上 多 花费 心思 ， 他 们 绞 尽 脑汁 的 是 他 们 正在 处 理 的 数据 ,而且 他 们 把 数据 看 作 是 一 个 集合 。 
在 一 台 计 算 机 中 ， 数 据 的 集合 被 抽象 为 一 个 文件 。 程 序 需要 针对 数据 进行 加 工 处 理 。 我 们 常 
常 把 数据 存放 在 辅助 存储 设备 上 ， 因 为 主 存储 器 成 本 太 昂 贵 了 ， 所 以 不 能 用 来 保存 我 们 需要 
访问 的 所 有 数据 。 现 在 ， 这 些 设 备 大 多 数 是 旋转 式 的 磁盘 驱动 器 。 作 为 应 用 程序 设计 人 员 ， 
我 们 不 想 纠结 在 成 千 上 万 种 不 同类 型 的 磁盘 驱动 器 的 操作 细节 方面 ， 我 们 更 愿意 从 某 种 抽象 
层次 来 看 待 我 们 的 数据 。 通 常 ， 我 们 认为 一 个 文件 就 是 由 若干 记录 或 者 字 节 组 成 的 一 个 集 
合 。 因 此 ， 大 多 数 操作 系统 的 一 项 主要 功能 就 是 提供 辅助 存储 器 上 的 文件 的 抽象 机 制 。 一 个 
文件 的 内 容 通常 只 对 应 用 程序 来 说 才 是 有 意义 的 ， 由 此 我 们 想 要 说 明 的 是 ， 操 作 系统 通常 并 
不 清楚 文件 的 内 部 结构 。 但 有 少数 情况 例外 ， 比 如 操作 系统 可 以 运行 的 可 执行 (二进制 ) 程 
序 以 及 被 用 来 生成 那些 文件 的 目标 模块 。 相 关 文 件 拥有 由 操作 系统 自身 所 定义 的 结构 ， 且 有 
关 结 构 应 当 被 所 有 用 来 生成 可 执行 文件 的 链接 程序 (linker) 或 装 入 程序 (loader， 或 称 为 加 
载 程序 ) 等 实用 工具 以 及 用 于 把 源 程序 文件 转变 生成 目标 模块 的 编译 器 (compiler) 和 汇编 
器 (assembler) 所 掌握 。 

在 第 12.1 节 ， 我 们 将 介绍 文件 系统 的 概念 以 及 文件 系统 是 如 何 装配 到 操作 系统 中 的 。 
现代 的 计算 机 通常 包含 几 十 万 个 文件 ， 必 须 能 够 有 效 地 组 织 文 件 以 保证 可 以 找到 有 关 的 数 
据 。 为 此 ,我们 紧 接着 讨论 了 用 于 支持 文件 系统 的 目录 的 相关 机 制 。 关 于 如 何 访 问 文件 中 的 
数据 ,不同 的 应 用 程序 有 不 同 的 要 求 。 有 了 时， 数据 可 以 是 按 顺 序 连续 地 进行 处 理 。 而 有 些 时 
候 ， 处 理 则 是 随机 的 。 还 有 一 些 时 候 ， 通 过 一 个 特定 的 关键 字 ， 很 容易 就 能 找到 一 条 记录 。 
而 其 他 时 候 ， 我 们 则 需要 根据 内 容 来 访问 相应 的 记录 。 在 第 12.3 节 中 ,将 会 阐述 应 用 程序 
能 够 用 来 访问 文件 中 的 数据 的 各 种 各 样 的 方法 。 随 机 存 取 介 质 上 的 文件 系统 需要 记录 该 介质 
的 哪些 部 分 包含 有 数据 ， 哪 些 部 分 是 空闲 和 可 以 使 用 的 。 因 此 ， 接 下 来 我 们 将 会 探究 文件 
系统 中 当前 尚未 分 配给 任何 文件 的 空闲 空间 的 监测 需求 以 及 用 于 跟踪 空闲 空间 的 不 同 结构 。 
在 第 12.5 节 中 ， 我 们 探讨 了 关于 文件 本 身 结构 的 话题 ， 讨 论 了 各 种 方法 的 权衡 问题 。 最 后 ， 
在 第 12.6 节 中 ,我们 对 全 章 内 容 进 行 了 总 结 。 


12.1 引言 


文件 系统 通常 按 分 层 结构 进行 设计 ， 且 每 一 层 都 为 它 的 上 层 提 供 服务 。 关 于 这 些 层 次 的 
功能 划分 ， 各 类 操作 系统 都 有 一 套 独特 的 划分 方案 。 不 过 ， 有 两 项 划分 原则 对 于 所 有 的 操作 
系统 都 是 成 立 的 : 一 是 顶层 的 应 用 程序 接口 (API) 应 建立 起 文件 概念 的 抽象 机 制 ， 二 是 底 
层 直接 和 硬件 进行 交互 。 举 例 来 说 ，Linux 文件 系统 组 织 如 图 12-1 所 示 〈 图 中 各 层 从 左 到 右 
列 出， 分 别 对 应 自 项 向 下 的 各 层 )。 我 们 在 本 章 主要 讨论 文件 抽象 机 制 ， 关 于 底层 部 分 将 放 
到 下 一 章 进 行 讨论 。 
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图 12-1 Linux 文件 和 输入 /输出 系统 


12.2 目录 


在 程序 使 用 文件 之 前 ， 其 首先 需要 找到 该 文件 。 操 作 系 统 需要 为 程序 要 搜索 的 文件 提供 
某 种 索引 ， 我 们 称 这 些 索 引 为 目录 ( directory)。( 随 着 越 来 越 多 的 对 计算 机 并 不 非常 了 解 的 
人 也 开始 使 用 计算 机 ， 关 于 这 些 结构 的 另 一 个 术语 ， 即 文件 夹 (folder)， 也 同时 得 到 了 大 家 
的 普遍 使 用 。) 毫 无 疑问 ， 目 录 会 用 来 存放 文件 的 名 字 ， 但 是 目录 也 会 同时 存放 关于 文件 的 
其 他 数据 。 在 一 些 操作 系统 中 ， 对 于 每 个 文件 可 能 会 有 很 多 其 他 的 数据 需要 保存 ， 而 在 另外 
一 些 操作 系统 中 ， 则 仅 需 保存 关于 文件 的 很 少量 的 其 他 数据 。 这 里 ， 关 于 文件 的 其 他 信息 并 
不 是 文件 数据 的 组 成 部 分 ， 称 之 为 文件 元 数据 ( file metadata)。 其 中 的 某 些 信息 项 几乎 是 通 
用 的 ， 而 另外 一 些 则 非常 少见 。 显 然 ， 我 们 需要 一 个 磁盘 地 址 来 指向 文件 数据 的 开始 位 置 。 
而 一 般 情 况 下 ， 我 们 也 想 知 道 文件 的 大 小 。 表 12-1 中 列 出 了 我 们 在 各 类 操作 系统 中 可 能 找 
到 的 关于 文件 的 一 些 元 数据 的 例子 。 任 何 操作 系统 都 不 可 能 拥有 所 有 这 些 信息 项 一 一 在 某 些 
情况 下 ， 某 些 信息 项 甚至 代表 实现 相同 目的 所 采用 的 不 同方 法 。 在 一 些 操作 系统 中 ， 相 关 信 
息 存放 在 文件 的 目录 项 中 。 而 在 另外 一 些 操作 系统 中 ， 则 被 存放 在 一 个 独立 的 结构 中 一 一 最 
值得 一 提 的 是 ， 由 UNIX 衍生 出 来 的 各 类 操作 系统 一 般 采用 所 谓 索引 结 点 (inode) 的 一 种 外 
部 表 里 来 存放 相关 信息 。 


12.2.1 逻辑 结构 


有 许多 不 同 的 逻辑 结构 可 用 来 存放 文件 
系统 的 目录 结构 。 在 本 节 中 ,我们 将 介绍 几 

种 常用 的 结构 。 
单 级 目录 结构 

我 们 如 何在 逻辑 上 组 织 一 个 磁盘 的 目 
录 ， 在 某 种 程度 上 取决 于 磁盘 的 大 小 。 就 像 
我 们 在 第 4 章 中 所 讨论 的 那样 ， 早 期 的 磁盘 


表 12-1 一 些 可 能 的 目录 信息 项 







一 起 始 块 号 
最 大 文件 长 度 
当前 文件 大 小 


保护 类 属性 (可 能 非常 复杂 ) 















创建 日 期 和 时 间 文件 分 配 类 型 
最 后 被 修改 的 日 期 和 时 间 || 最 后 被 访问 的 日 期 和 时 间 
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空间 相当 小 〈 仅 有 几 十 万 字 节 )， 因 而 文件 的 数量 也 很 少 。 为 了 最 大 限度 地 利用 有 限 的 空间 ， 
存放 的 文件 名 要 尽 可 能 地 短 (6 一 8 字 节 是 相当 普遍 的 )， 而 存放 的 指向 磁盘 块 的 指针 也 要 尽 
可 能 小 。 整 个 磁盘 通常 只 有 一 个 目录 。 在 图 12-2 中 ， 我 们 给 出 了 这 样 的 一 个 单 级 目录 结构 。 

259| 正如 我 们 在 前 面 的 章节 中 所 提 到 的 那样 ， 一 些 拥 有 单 级 目录 结构 的 操作 系统 试图 通过 把 组 名 
与 文件 关联 起 来 ， 以 呈现 一 种 两 级 目录 结构 的 假象 ， 从 而 使 用 户 可 以 查看 目录 并 且 只 能 看 到 
特定 组 别 的 文件 。 


文件 长 度 












mm Te le ww | 


图 12-2 单 级 目录 示例 


树 形 目 录 结 构 

伴随 时 间 的 推移 ， 磁 盘存 储 容量 已 经 有 了 显著 的 增长 。 对 于 当前 的 磁盘 驱动 器 技术 而 
言 ,拥有 容量 为 数 千 亿 字 节 ( 即 几 百 GB) 的 硬盘 是 一 台 典 型 的 新 型 个 人 计算 机 的 标准 配置 。 
对 于 这 样 的 磁盘 ， 上 面 承载 有 数 十 万 个 文件 是 很 正常 的 。 一 般 用 户 对 于 其 中 的 很 多 文件 根本 
不 了 解 或 毫 不 知情 。 面 对 如 此 庞大 的 硬盘 ， 单 一 目录 是 无 法 发 挥 作用 的 。 为 此 ， 在 磁盘 目录 
的 逻辑 结构 组 织 中 ， 做 出 的 一 个 关键 的 改进 就 是 支持 多 个 目录 。 其 主要 的 技巧 就 是 ， 除 了 多 
许 目录 指向 文件 之 外 ， 还 允许 目录 指向 其 他 的 目录 。 如 果 我 们 限制 此 类 链接 引用 仅 指 向 那些 
不 会 拥有 其 他 链接 而 指向 自身 (包括 起 始 目 录 ) 的 目录 ， 则 由 此 产生 的 结构 就 是 一 棵 以 起 始 
目录 作为 树 根 的 树 形 目录 结构 。 举 例 说 明 如 图 12-3 所 示 。 





图 12-3 树 形 目录 结构 示例 


有 了 这 样 的 层次 式 目录 组 织 ， 我 们 就 可 以 将 文件 划分 成 不 同 的 类 别 。 在 两 个 以 上 用 户 使 

ze0]| 用 的 机 器 中 ,我 们 可 以 给 每 个 用 户 设立 一 个 主 目录 ， 其 中 包含 有 分 布 在 各 子 目录 下 的 相应 用 
户 的 所 有 数据 文件 。 各 式 各 样 的 子 目 录 也 可 以 用 来 组 织 不 同类 型 的 文件 一 一 其 中 有 的 可 能 用 

于 实用 程序 ， 有 的 用 于 游戏 软件 ， 有 的 用 于 电子 邮件 ， 等 等 。 目 录 划 分 的 这 一 过 程 可 以 延伸 
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到 任意 深度 。 例 如 ， 电 子 邮 件 目录 可 以 按 与 工作 、 学 校 、 家 庭 、 朋 友和 技术 等 相关 而 进一步 
划分 为 若干 目录 ， 而 学 校 目 录 还 可 以 按 每 个 班 进一步 划分 为 更 细 一 级 的 目录 。 

这 种 目录 组 织 方式 会 带 来 一 种 副作用 ， 即 我 们 可 以 拥有 许多 相同 文件 名 的 文件 ， 只 是 需 
要 把 它们 存放 在 不 同 的 目录 中 。 这 将 允许 一 组 在 不 同 主 目录 中 进行 操作 的 用 户 使 用 相同 的 文 
件 名 。 图 12-3 给 出 了 一 个 看 似 不 太 可 能 但 却 完全 合法 的 例子 ， 其 间 许 多 子 目 录 中 包含 有 相 
同文 件 名 的 文件 分 组 。 但 是 ， 这 一 特征 是 要 付出 代价 的 一 一 文件 的 名 字 就 不 再 可 能 由 单个 的 
名 字 而 唯一 指定 了 。 为 了 无 歧义 地 引用 一 个 文件 ， 我 们 必须 要 给 出 由 通 向 相应 文件 的 目录 所 
组 成 的 完整 的 路 径 (path)。 通 常 ， 我 们 会 用 一 些 不 可 能 用 作文 件 名 组 成 部 分 的 分 隔 符 把 子 目 
录 名 分 隔 开 来 。 字 符 “/” 和 ”是 最 常用 到 的 分 隔 符 。 于 是 ， 对 于 图 12-3， 为 了 无 歧义 地 
确定 图 中 所 显示 的 一 个 文件 如 “N”， 我 们 将 不 得 不 给 出 类 似 这 样 的 名 字 “\W\T\N”。 

无 环 图 目录 结构 

遗憾 的 是 ， 通 过 一 个 树 形 目 录 结 构 是 不 可 能 对 现实 世界 进行 精确 建 模 的 。 例 如 ， 金 丝竹 
是 一 种 鸟 。 如 果 我 们 有 金 丝 瞧 的 一 张 数字 图 片 ， 并 且 我 们 正在 研究 生物 学 ， 那 么 我 们 有 可 能 
把 这 张 数字 图 片 放 在 拥有 猫 和 其 他 动物 的 相关 信息 的 一 个 目录 里 。 同 时 ， 金 丝 省 还 会 飞 ， 为 
此 ， 如 果 我 们 正在 研究 工程 学 ， 我 们 也 可 能 把 这 张 数字 图 片 放 在 拥有 飞机 和 其 他 会 飞 的 东西 
的 相关 信息 的 一 个 目录 里 。 还 有 ， 金 丝 汰 是 黄 颜色 的 ， 所 以 ， 如 果 我 们 是 艺术 家 ， 我 们 还 可 
能 会 把 这 张 数字 图 片 放 在 拥有 黄油 、 柠 檬 及 其 他 黄色 物品 相关 信息 的 一 个 目录 里 。 但 是 ， 如 
果 我 们 正在 研究 生物 医学 工程 和 颜色 视觉 系统 ， 我 们 就 可 能 对 这 个 文件 如 何 分 类 无 所 适 从 和 
不 知 所 措 了 。 如 果 只 有 树 形 结构 的 目录 ， 我们 常常 会 为 该 如 何 对 一 些 文件 进行 分 类 而 左右 
为 难 。 随 之 而 来 的 是 ， 以 后 或 许 我 们 不 能 记 起 当初 把 金 丝 瞧 的 图 片 放 到 了 哪个 文件 夹 。 有 
时 用 来 摆脱 这 种 困境 的 一 种 解决 方案 是 允许 目录 构成 有 向 无 环 图 ( Directed Acyclic Graph， 
DAG)。 为 了 实现 这 种 方案 ， 会 用 到 一 种 所 谓 别 名 ( alias) 的 特殊 类 型 的 目录 项 。 别 名 目录 
项 并 不 直接 指向 一 个 文件 ， 而 是 指向 另外 的 一 个 目录 项 。( 事 实 上 ， 别 名 目录 项 可 以 指向 文 
件 ， 但 是 那样 会 引发 一 些 问题 ， 具 体 我 们 放 到 以 后 再 进行 讨论 。 因 为 ， 这 两 种 实现 机 制 之 间 
的 差别 与 这 里 的 内 容 没 有 多 大 关系 。) 

遗憾 的 是 ， 从 树 形 结构 转变 为 有 向 无 环 图 将 带 来 一 些 问 题 ， 必 须要 予以 考虑 和 处 理 。 最 
简单 的 例证 是 ， 当 有 程序 试图 去 统计 系统 中 所 有 文件 占用 的 所 有 空间 的 时 候 所 产生 的 问题 。 
如 果 不 考虑 别名 目录 项 ， 那 么 对 于 有 一 些 文件 不 止 一 次 被 引用 的 情形 ， 相 应 程序 就 可 能 得 出 
错误 的 空间 总 量 结果 。 另 外 一 个 大 的 问题 是 ， 系 统 应 该 如 何 裁决 一 个 文件 可 以 真正 被 删除 
掉 。 考 虑 如 图 12-4 所 示 的 情形 。 其 中 ,我们 可 以 看 到 三 个 目录 。 顶 层 目录 有 两 个 目录 项 分 
别 指向 了 子 目录 W 和 Q， 同 时 还 有 一 个 目录 项 指向 了 文件 A。 而 且 ， 子 目录 W 中 也 包含 有 
一 个 目录 项 指向 了 文件 A。 假设 用 户 从 子 目 录 W 中 要 删除 文件 A, 但 因为 在 顶层 目录 中 还 
存在 对 该 文件 的 其 他 引用 ， 所 以 操作 系统 实际 上 并 不 应 当 移 除 该 文件 。 





图 12-4 两 个 目录 项 指向 一 个 文件 的 情形 
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有 两 种 机 制 有 时 被 用 来 解决 这 个 问题 。 第 一 种 技术 就 是 区 别 对 待 文件 的 主 引 用 和 文件 
的 任何 别名 。 操 作 系 统 在 主 目录 项 中 还 应 包含 一 个 引用 计数 。 当 为 一 个 文件 增加 了 一 个 别 
名 时 ， 相 应 的 引用 计数 应 当 递 增 。 而 如 果 删 除 一 个 别名 ， 对 应 文件 的 引用 计数 应 当 递 减 ， 
且 如 果 计 数 变 为 零 ， 对 应 文件 就 可 以 被 真正 删除 掉 。 不 过 ， 这 种 机 制 在 主 引用 已 被 删除 而 
别名 依然 保留 的 情况 下 ， 会 存在 一 些 问题 。 第 二 种 技术 则 是 把 所 有 的 别名 变 成 符号 式 引 用 
( symbolic reference)， 使 其 包含 相应 的 路 径 信息 。 早 些 时 候 我 们 所 说 的 别名 应 该 指向 对 应 文 
件 的 目录 项 ， 而 不 是 文件 本 身 ， 就 是 这 个 意思 。 在 这 种 情况 下 ， 如 果 图 12-4 中 的 下 层 的 引 
用 是 主 引 用 ， 那 么 顶层 目录 的 第 二 个 目录 项 实际 上 应 当 包 含 的 是 “\W\A”， 而 不 是 一 个 指向 
磁盘 上 对 应 文件 的 指针 。 


12.2.2 ”物理 结构 


早期 的 系统 把 相当 多 的 注意 力 都 放 在 了 目录 检索 速度 方面 。 为 此 ， 早 期 的 系统 有 时 会 使 
用 诸如 散 列 之 类 的 技术 来 提高 目录 检索 速度 。 然 而 ， 在 最 近 20 年 左右 的 时 间 里 ， 处 理 器 和 
内 存 提高 的 速度 比 磁 盘 驱 动 器 提高 的 速度 至 少 要 快 10 个 数量 级 以 上 。 因 此 ， 大 多 数 现代 的 
操作 系统 并 不 担心 此 类 问题 ， 而 且 目 录 也 不 是 按照 某 种 特定 顺序 进行 过 排序 的 。 对 目录 的 检 
索 只 是 按 顺 序 方式 进行 。 大 多 数 情况 下 ， 人 们 倾向 于 把 目录 维持 在 比较 小 的 水 平 上 一 一 大 臻 
在 100 个 目录 项 以 下 。 


12.2.3 ”目录 操作 


操作 系统 必须 支持 关于 目录 的 各 种 不 同类 型 的 操作 。 有 人 可 能 会 认为 这 些 操作 只 是 那些 
用 来 支持 文件 的 操作 ， 因 为 目录 本 质 上 就 是 文件 。 但 是 ,文件 和 目录 之 间 还 是 存在 一 些 区 别 
的 。 首 先 ， 考 虑 到 文件 系统 包含 的 一 点 错误 就 可 能 引发 潜在 的 灾难 性 后 果 ， 所 以 大 多 数 操作 
系统 并 不 允许 应 用 程序 直接 对 目录 进行 写 操作 。 相 反 ， 应 用 程序 必须 通过 调用 特殊 的 例 程 才 
能 创建 一 个 新 的 文件 或 目录 ， 或 者 完成 关于 目录 的 任何 其 他 操作 。 表 12-2 给 出 了 操作 系统 
可 能 支持 的 一 些 目录 操作 类 型 。 

表 中 列 出 的 第 一 项 操作 是 改变 工作 目录 。 就 像 前 面 所 提 到 的 ， 每 个 子 目录 中 可 以 包含 
与 其 他 子 目录 中 相同 本 地 名 称 ( 译 者 注 : 实际 上 就 是 文件 名 ) 的 文件 ， 因 此 ， 需 要 一 个 路 径 
名 来 无 歧义 和 明确 地 指定 一 个 文件 。 当 我 们 在 命令 行 中 输入 文件 名 和 运行 一 个 程序 的 时 候 ， 
我 们 并 不 想 总 是 无 可 奈何 地 输入 路 径 名 ( 译 者 注 : 路 径 名 经 常 比较 长 )， 所 以 操作 系统 便 采 
用 了 一 个 所 谓 工作 目录 的 概念 。 基 本 想法 是 ， 用” 表 12-2 操作 系统 应 当 支 持 的 目录 操作 类 型 
户 应 当 采 取 一 些 措施 来 指定 一 个 特定 的 目录 作为 一 一 一 一 一 一 一 一 一 一 





改变 工作 目录 
当前 工作 目录 ( current working directory)， 有 时 
干脆 就 称 作 工作 目录 。 一 种 可 以 确定 工作 目录 的 a 


方法 是 记录 相关 信息 到 系统 中 ， 并 建立 健全 系统 


登录 环节 。 支 持 相关 登录 的 系统 通常 会 在 登录 时 nie hi es ke 


把 对 应 用 户 的 主 目录 指定 为 当前 工作 目录 。 不 包 人 
括 任何 路 径 信 息 的 文件 名 的 一 个 引用 被 称 为 非 限 删除 文件 
定 文件 名 (unqualified name)。 采 用 非 限定 文件 查找 指定 文件 
名 方式 引用 的 任何 命令 都 将 意味 着 ， 相 应 的 文件 重 命名 文件 


应 该 位 于 当前 工作 目录 中 。 为 此 ， 在 图 12-5 中 ， 遍历 目录 树 
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如 果 目 录 W 是 当前 工作 目录 ， 那 么 对 文件 $ 的 引用 就 会 被 认为 是 对 该 目录 下 的 对 应 文件 S 
的 引用 。 而 为 了 引用 目录 W 下 的 子 目 录 T 中 的 文件 S， 程 序 则 必须 要 把 通 往 该 目录 的 路 径 
作为 指定 名 称 的 组 成 部 分 。 这 种 情况 下 ， 可 以 为 “\WAT\S” 或 者 “.T\S”。 第 一 种 引用 方式 
采用 的 是 绝对 路 径 名 ( absolute pathname)， 其 以 用 来 分 隔 路 径 名 中 各 目录 名 的 分 隔 符 打头 ， 
故而 可 以 被 解析 为 起 始 于 目录 树 的 根部 ( 译 者 注 : 即 所 谓 的 根 目 录 )。 第 二 种 引用 方式 采用 
的 是 所 谓 的 相对 路 径 名 (relative pathname)， 此 处 的 “.” 是 用 来 指定 当前 工作 目录 的 一 个 特 
殊 的 名 字 ， 所 以 该 路 径 名 表示 的 是 ， 对 应 路 径 从 当前 工作 目录 开始 ， 然 后 到 达 子 目录 T， 进 
而 在 那里 就 会 找到 文件 S。 





图 12-5 目录 结构 中 的 路 径 





另外 一 种 改变 当前 工作 目录 的 常用 机 制 是 使 用 改变 目录 ( change directory) 的 命令 
通常 是 像 “cd” 或 “chdir” 之 类 的 命令 。 该 命令 可 以 指定 绝对 路 径 ， 也 可 以 指定 相对 路 径 。 
通常 ， 可 以 采用 简化 符号 ， 例 如 ,“ed..” 将 会 把 当前 目录 的 父 目 录 变 为 工作 目录 。 在 Linux 
和 其 他 类 UNIX 系统 中 ， 不 带 任何 参数 的 “ cd” 命令 将 会 把 用 户 的 主 目录 设立 为 当前 工作 
目录 。 

关于 目录 创建 和 删除 的 命令 非常 简单 。 再 次 强调 ， 这 些 功能 函数 之 所 以 存在 ， 是 因为 我 
们 通常 不 允许 应 用 程序 直接 对 目录 进行 写 操作 。 相 反 ， 我 们 要 求 它们 通过 使 用 特殊 的 操作 系 
统 调用 来 完成 这 些 操作 功能 。 同 时 ， 还 有 一 些 特 殊 的 实用 例 程 mkdir ( 译 者 注 : 用 于 创建 目 
录 ) 和 rmdir ( 译 者 注 : 用 于 删除 目录 ) 支持 用 户 通过 命令 解释 器 来 请 求 相 应 操作 。 通 常情 
况 下 ， 操 作 系统 可 能 不 会 提供 内 置 功 能 函数 来 列 出 普通 文件 的 内 容 。 但 是 ， 因 为 目录 是 一 类 
非常 特殊 的 文件 ， 所 以 操作 系统 必须 要 提供 一 个 功能 函数 来 为 应 用 程序 列 出 目录 的 内 容 。 同 
样 ， 也 有 相应 的 实用 例 程 (dir 或 ls8， 译 者 注 : 用 于 列 出 指定 目录 下 的 文件 ) 用 来 支持 用 户 通 
过 命令 行 接口 来 访问 对 应 的 功能 。 然 而 ， 当 应 用 程序 需要 创建 一 个 新 的 文件 时 ， 其 必须 拥有 
一 种 途径 来 要 求 操 作 系 统 去 执行 相应 的 操作 。 类 似 地 ， 程 序 可 能 想 要 删除 一 个 不 再 需要 的 文 
件 。 一 般 情 况 下 ， 不 会 专门 设立 此 类 简单 的 实用 例 程 来 创建 一 个 新 的 文件 ， 因 为 这 样 的 文件 
是 空 的 ， 意 义 不 大 。 为 此 ,文件 往往 是 作为 某 些 其 他 操作 的 副产品 而 被 创建 的 。 关 于 此 类 操 
作 ， 最 接近 或 具有 实用 性 质 的 是 文件 复制 命令 (cp 或 copy)。 在 Linux 平台 上 ， 用 户 可 以 把 
特殊 的 伪 文 件 “ /dev/zero ”复制 到 一 个 文件 名 ， 从 而 创建 一 个 二 进 制 的 零 的 流 文件 。 当 然 ， 
文件 常常 通过 使 用 像 vi 或 记事 本 (notepad) 之 类 的 文本 编辑 器 等 实用 程序 来 进行 创建 。 还 
有 一 些 如 在 微软 办 公 软 件 中 的 应 用 程序 ， 则 会 创建 它们 自己 的 特定 类 型 的 文件 ， 如 .doc 文 
件 或 .xls 文件 。 文 件 删除 则 通常 会 以 像 del 或 rm 之 类 的 具有 文件 删除 功能 的 实用 例 程 提供 
给 用 户 。 删 除 目录 也 是 一 种 特殊 的 实用 例 程 ， 一般 拥有 像 rmdir 之 类 的 名 字 。 男 外 ， 搜 索 目 
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录 来 查找 文件 也 常常 是 应 用 程序 需要 完成 的 事情 ， 其 目的 并 不 是 打开 文件 用 于 输入 。 操 作 系 
统 (或 编程 语言 库 模 块 ) 一 般 会 提供 此 类 功能 。 确 切 地 说 ， 当 应 用 程序 想 要 创建 一 个 新 的 文 
件 时 ， 其 需要 进行 目录 搜索 和 文件 查找 。 这 种 情况 下 ， 首 先 应 当 检查 确认 在 当前 目录 中 没有 
使 用 相应 指定 的 文件 名 。( 某 些 编程 语言 库 也 可 能 实现 这 样 的 功能 。) 


12.2.4 文件 系统 元 数据 


我 们 之 前 提 到 过 ， 目 录 项 所 包含 的 关于 文件 的 信息 并 不 是 文件 本 身 的 组 成 部 分 ， 相 关 信 
息 称 作 文件 元 数据 。 在 文件 系统 中 ,还 有 一 些 其 他 的 信息 不 是 关于 特定 文件 的 ， 所 以 它们 不 
是 目录 项 的 组 成 部 分 。 例 如 ,文件 系统 中 的 第 一 个 目录 放 在 什么 地 方 ? 后 面 我 们 将 会 看 到 ， 
有 一 些 其 他 的 结构 用 来 向 我 们 解析 像 如 何 找到 空闲 磁盘 块 之 类 的 问题 ， 具 体 实现 细节 对 于 特 
定 的 文件 系统 往往 会 有 变化 。 但 是 ， 总 会 有 这 样 的 一 些 其 他 类 型 的 结构 ， 并 且 它 们 对 于 文件 
系统 的 完整 性 是 非常 重要 的 ， 它 们 统称 为 文件 系统 元 数据 (file system metadata ) 。 


12.3” 存 取 方 法 


操作 系统 为 应 用 程序 提供 了 代表 文件 抽象 的 应 用 程序 接口 。 应 用 程序 接口 应 当 包 括 关 于 
“应 用 程序 如 何 告知 操作 系统 ， 其 想 要 访问 文件 的 哪 一 部 分 ”的 语义 。 不 同 的 应 用 程序 需要 
不 同 的 存 取 模式 及 存 取 方法 (access method， 或 称 为 访问 方法 )。 


12.3.1 顺序 存 取 


， 计 算 机 应 用 程序 被 设计 成 按 批量 方式 来 进行 信息 的 处 理 ， 且 相关 信息 已 经 根据 
i 于 了 排序 。 这 样 的 应 用 程序 需要 顺序 地 处 理 
文件 。 曾 经 有 一 段 时 间 ， 相 关 文 件 是 按照 字面 排 好 序 的 穿孔 卡片 秋 ， 后 来 才 变 成 了 存放 在 磁 
带 上 的 排 好 序 的 数据 块 。 系 统 可 能 拥有 一 个 关于 事务 处 理 的 诸如 计时 卡片 之 类 的 输入 文件 和 
一 个 诸如 工资 记录 的 主 文件 ， 且 它们 可 能 都 按 员工 编号 进行 了 排序 。 应 用 程序 将 从 每 个 文件 
的 开始 部 分 启动 文件 读 取 操作 ， 并 且 一 步 步 渐 进 式 地 对 每 个 文件 进行 读 取 ， 按 关键 字段 (此 
例 中 即 员工 编号 ) 保持 它们 的 同步 。 对 于 卡片 到 来 说 ， 记 录 的 大 小 是 固定 的 。 而 对 于 磁带 来 
说 ,记录 可 以 是 任意 一 个 合适 的 大 小 ， 一 直到 由 硬件 或 操作 系统 所 决定 的 某 个 最 大 值 。 对 于 
磁盘 存储 器 的 顺序 处 理 来 讲 ， 操 作 系 统 (或 软件 库 ) 必须 拥有 关于 各 文件 的 记录 大 小 的 某 种 
定义 ， 从 而 使 其 能 够 为 持 有 打开 文件 的 每 个 应 用 程 
序 记录 当前 位 置 (或 当前 记录 指针 ), 如 图 12-6 所 A。 
示 。( 注 意 ， 访 问 相 同文 件 的 不 同 进程 有 可 能 会 有 不 人 
同 的 当前 记录 指针 。) 对 于 标准 的 顺序 处 理 (或 称 为 | 国王 

顺序 存 取 或 顺序 访问 ) 的 每 次 读 操作 或 写 操作 而 言 ， 

操作 系统 将 会 为 之 对 当前 记录 指针 执行 递增 处 理 。 
同时 ， 应 用 程序 接口 中 还 常常 会 设立 一 条 命令 用 来 必 
重 置 当前 记录 指针 ， 使 其 指向 文件 的 开始 位 置 。 这 上 
项 操作 有 点 类 似 于 将 磁带 倒 回 到 起 始 位 置 的 操作 类 
型 。 鉴 于 磁盘 块 是 固定 大 小 的 ， 而 且 不 可 能 刚好 匹 
配 上 应 用 程序 的 记录 长 度 要 求 。 所 以 ， 对 于 操作 系 a 
统 来 说 ,将 两 条 以 上 的 逻辑 记录 组 合 起 来 存放 到 一 。 图 12-6 顺序 文件 及 当前 记录 指针 
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个 物理 数据 块 中 是 相当 常见 的 。 在 下 一 章 中 , 我 们 将 会 更 全 面 地 介绍 分 块 的 有 关内 容 。 


12.3.2 ”随机 存 取 = 


因为 磁盘 驱动 器 越 来 越 便宜 了 ， 所 以 辅助 存储 器 机 制 就 从 存储 在 磁带 上 变 成 了 存储 在 磁 
盘 驱 动 器 上 。 一 旦 数据 大 部 分 是 在 线 保存 的 ， 就 有 可 能 在 各 项 事务 发 生 时 对 其 进行 及 时 地 处 
理 ， 而 不 是 把 它们 积攒 下 来 ， 然 后 再 去 顺序 地 批量 处 理 。 一 般 而 言 ， 事务 处 理 比 批量 处 理 更 
为 可 取 ， 是 在 于 其 支持 管理 人 员 更 近乎 于 实时 地 去 记录 和 跟踪 企业 的 运行 状况 。 然 而 ， 这 便 
意味 着 应 用 程序 必须 要 随机 地 ， 而 不 是 纯粹 顺序 地 访问 主 文件 数据 。 为 此 ， 需 要 对 文件 的 应 
用 程序 接口 进行 扩展 ， 以 涵盖 另 一 种 模型 ， 即 随机 存 取 (random access， 或 称 为 随机 访问 ) 
模型 。 在 该 模型 中 ， 应 用 程序 将 告知 操作 系统 ， 其 需要 访问 文件 的 哪 条 记录 ， 而 操作 系统 将 
会 直接 移动 到 对 应 记录 ， 对 其 进行 访问 ， 并 执行 读 操作 或 写 操作 。 通 常情 况 下 ， 这 将 需要 从 
关键 字 取 值 到 记录 编号 的 某 种 简单 的 映射 。 例 如 ,一 家 小 公司 可 能 只 是 顺序 地 分 配 了 员工 编 
号 ,并 把 员工 编号 作为 记录 编号 。 在 某 些 操作 系统 中 ， 这 种 寻 址 表示 为 一 个 记录 编号 ， 而 在 
其 他 的 操作 系统 中 ， 则 被 表示 为 从 文件 的 起 始 位 置 开始 算 起 的 字 节 偏 移 量 。 

注意 ， 随 机 存 取 文件 也 可 以 实施 顺序 存 取 方 式 。 当 应 用 程序 随机 地 访问 一 条 记录 时 ,其 
将 会 抛弃 和 暂时 离开 用 于 定位 到 下 一 条 记录 的 当前 记录 指针 。 这 时 ， 应 用 程序 还 可 以 发 出 一 
条 read next( 即 读 取 下 一 条 记录 ) 的 操作 命令 ， 于 是 操作 系统 将 会 返回 下 一 条 记录 ， 并 将 当 
前 记录 指针 递增 。 在 图 12-7 中 ,我 们 可 以 看 到 这 一 场景 ， 其 中 ，34 号 员工 的 员工 编号 用 来 
访问 文件 中 的 对 应 记录 。 如 果 应 用 程序 执行 了 read next 操作 ， 其 将 获得 当前 记录 的 下 一 条 
记录 。 

为 了 能 够 从 随机 存 取 文件 的 任何 位 置 都 可 以 开始 访问 ， 操 作 系 统 常 常会 提供 一 条 seek 
命令 ( 译 者 注 : 关于 文件 读 写 指针 随机 定位 的 命令 )， 用 于 把 当前 记录 指针 定位 和 指向 到 对 
应 关键 字 取 值 等 于 或 大 于 给 定 键 值 的 第 一 条 记录 。 当 操作 系统 一 次 只 运行 一 个 进程 时 ， 这 条 
命令 实际 上 会 将 磁头 定位 到 文件 的 相应 位 置 ( 即 其 将 会 查找 和 定位 数据 的 物理 位 置 )。 现 在 ， 
它 仅仅 是 一 种 逻辑 定位 而 已 。 


12.3.3 ”更 高 级 别 的 存 取 方 法 


大 多 数 操作 系统 至 少 会 提供 对 顺序 存 取 方 法 和 随机 存 取 方 法 的 支持 。 一 少 部 分 操作 系 
统 还 会 提供 一 种 或 多 种 更 高 级 别 的 存 取 方 法 。 我 们 
将 在 本 节 的 剩余 部 分 ， 就 两 种 此 类 的 存 取 机 制 加 以 es 
阐述。 大 多 数 此 类 的 高 级 存 取 方 法 还 包含 在 数据 库 和 人“ i 全 和 
系统 中 ， 有 时 也 作为 库 模块 提供 对 高 级 语言 的 支持 。 [ 
拥有 操作 系统 提供 的 存 取 方 法 意味 着 ， 只 要 保证 操 | 
作 系统 的 存 取 方法 对 相关 高 级 语言 进行 支持 的 应 用 | 
程序 接口 的 语义 足够 相近 ， 那 么 仅 需 完成 很 少 的 开 | 
发 工作 就 可 以 支持 许多 高 级 语言 。 

索引 存 取 

对 于 大 公司 的 员工 文件 的 处 理 而 言 ， 随 机 存 取 
往往 不 能 像 处 理 小 公司 的 员工 文件 时 那么 有 效 。 时 
不 时 地 ， 可 能 会 有 许多 员工 退休 、 离 开 公司 或 者 被 ”图 12-7 随机 存 取 文件 及 存 取 方法 示例 
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解雇 ， 等 等 ， 其 结果 是 在 主 文件 中 将 会 出 现 许 多 不 是 描述 现 有 员工 的 记录 。 在 这 种 情况 下 ， 
操作 系统 可 以 提供 一 种 称 为 索引 存 取 ( indexed access) 的 存 取 方法 。 此 类 存 取 方法 的 一 个 相 
当 常 见 的 术语 是 索引 顺序 存 取 方法 (Indexed Sequential Access Method，ISAM ) 。 

这 种 存 取 方法 的 工作 机 理 如 图 12-8 所 示 。 图 中 显示 的 是 关于 一 家 零售 店 的 数据 文件 。 
该 文件 包括 三 个 区 域 : 用 于 保存 数据 记录 的 主 数据 ( primary data) 区 域 、 对 记录 中 主 关键 字 
字段 进行 索引 的 主键 (primary key) 区 域 以 及 对 另外 一 个 变量 ( 即 辅助 关键 字 ) 进行 索引 的 
次 键 (secondary key) 区 域 。 伴 随 记录 不 断 地 被 添加 到 文件 中 ， 相 关 记录 将 会 顺序 地 写 人 主 
数据 区 域 。 然 而 ， 对 于 每 一 条 被 写 到 主 数据 区 域 的 记录 来 说 ， 都 会 有 一 条 额外 的 记录 被 写 到 
主键 区 域 ， 同 时 还 有 另 一 条 记录 被 写 到 次 键 区 域 。( 注 意 ， 可 能 没有 次 键 区 域 ， 但 也 可 能 有 
多 个 次 键 区 域 ,) 主键 区 域 和 次 键 区 域 的 各 条 记录 均 按 相关 联 的 关键 字 字 段 取 值 的 大 小 有 序 
存放 。 在 图 中 ， 用 来 索引 数据 的 关键 字 字 段 有 两 个 : 零售 店 库存 编号 和 制造 商 商 品 编号 。 为 
此 ， 当 0 号 记录 被 写 人 主 数据 区 域 的 时 候 ， 一 条 记录 就 会 被 写 人 主键 区 域 (该 记录 用 以 说 明 
零售 店 库存 编号 ABC 在 0 号 数据 记录 中 被 找到 )， 同 时 还 有 另外 一 条 记录 被 写 入 次 键 区 域 
(该 记录 用 以 说 明 制 造 商 商品 编号 CBA 在 0 号 数据 记录 中 被 找到 )。 同 样 ， 当 第 二 条 记录 写 
进 主 数据 区 域 的 时 候 ， 类 似 的 记录 也 会 被 写 到 主键 区 域 和 次 键 区 域 。 但 是 ， 当 添加 第 三 条 记 
录 时 ， 被 添加 到 主键 区 域 的 那 条 记录 会 引发 一 个 问题 ， 原 因 在 于 若 直接 添加 该 条 主键 记录 ， 
将 不 再 保证 主键 区 域 的 顺序 性 。 为 此 ,我们 不 得 不 通过 关键 字 的 取 值 来 对 这 个 区 域 进行 排 
序 。 有 很 多 构建 键 码 区 域 ( 译 者 注 : 即 主键 区 域 或 次 键 区 域 ) 但 回避 对 整个 文件 进行 实际 排 
序 的 技术 ， 包 括 二 叉 树 (binary trees, 或 B 树 )、 散 列 法 以 及 多 级 索引 。 


索引 “零售 店 制造 商 ”其 他 零售 店 ”索引 制造 商 ”索引 
库存 编号 “商品 编号 ”信息 





主 数据 区 域 
图 12-8 索引 存 取 方法 及 相关 文件 示例 


注意 ， 关 键 字 不 一 定 是 一 个 单一 的 字段 。 例 如 ， 可 能 会 创建 一 个 把 姓 和 名 联系 到 一 起 的 
索引 。 同 时 还 要 注意 ， 关 键 字 字段 可 能 允许 键 值 重 复 ， 也 可 能 不 允许 键 值 重 复 。 图 12-8 中 
我 们 可 以 看 到 ， 在 这 家 零售 店 中 ， 一 个 单一 的 制造 商 商品 编号 (CBA) 拥有 两 个 不 同 的 零售 
店 库存 编号 (ABC 和 MNO)。 一 种 更 可 能 的 情况 是 ， 在 我 们 的 员工 文件 中 ,我 们 可 能 会 有 
两 个 比尔 * 史密斯 ( Bill Smiths)， 但 是 我 们 不 应 该 有 两 个 员工 拥有 相同 的 社会 保险 编号 。 这 
样 的 一 种 存 取 方 法 接近 于 一 个 数据 库 系 统 ， 但 是 有 点 简单 。 

我 们 在 图 12-8 中 所 讨论 的 那 三 个 区 域 可 能 是 单个 文件 的 组 成 部 分 ， 也 可 能 是 分 别 存储 
为 独立 的 文件 。 让 这 三 个 区 域 分 别 作为 独立 的 文件 存储 ， 可 能 会 使 文件 创建 之 后 的 为 另 一 关 
键 字 添 加 索引 的 操作 变 得 相对 简单 一 些 。 让 三 者 成 为 单独 文件 的 风险 在 于 ， 对 文件 进行 备份 
和 恢复 的 时 候 ， 最 终 很 容易 会 得 到 无 法 合 到 一 起 的 三 个 文件 〈 译 者 注 : 各 文件 数据 出 现 了 不 
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同步 的 情况 )。 当 然 ， 我 们 很 可 能 会 拥有 一 个 用 来 验证 并 可 能 重建 次 键 索引 文件 的 实用 程序 。 
但 是 ， 对 于 一 个 大 的 文件 来 说 ， 这 将 可 能 非常 耗 时 ， 而 且 我 们 往往 不 可 能 及 时 意识 到 当时 发 
生 了 问题 和 我 们 应 该 运行 那个 实用 程序 。 

散 列 存 取 

操作 系统 有 时 也 会 提供 另外 一 种 高 级 别 的 存 取 方法 ， 即 散 列 存 取 (或 称 为 散 列 访问 ) 方 
法 。 在 键 值 没有 全 部 被 用 完 的 情况 下 ,计算 关 键 字 字段 的 散 列 值 可 以 被 用 来 创建 一 个 随机 
键 值 用 于 快速 地 访问 一 个 随机 存 取 文件 。 考 庸 置疑 ， 生 成 散 列 键 值 可 能 会 创建 一 些 因为 源 关 
键 字 取 值 不 同 而 发 生 冲 突 的 记录 编号 ， 因 此 必须 要 提供 一 种 机 制 来 消解 这 些 冲 突 。 虽 然 散 列 
文件 存 取 方 法 不 像 索引 顺序 存 取 方 法 那样 普遍 ， 但 是 其 也 是 操作 系统 提供 的 一 种 非常 有 用 的 
工具 。 


12.3.4 ”原始 存 取 


对 于 某 些 应 用 程序 而 言 ， 使 用 文件 系统 提供 的 服务 可 能 无 法 达到 预期 结果 或 效果 。 在 应 
用 程序 对 性 能 要 求 比较 高 且 应 用 程序 开发 人 员 对 相关 文件 访问 模式 非常 了 解 的 情况 下 ， 就 可 
能 会 发 生 这 种 问题 。 究 其 原因 是 在 于 ， 为 大 多 数 应 用 程序 设计 的 服务 是 面向 那些 对 文件 处 理 
要 求 并 非 异 乎 寻常 的 所 谓 “ 普 通 的 ”或 “典型 的 ”应 用 程序 而 提供 的 。 为 解决 这 种 问题 ， 操 
作 系 统 有 时 会 提供 一 个 所 谓 的 原始 存 取 方 法 (raw access method)。 其 间 ， 操 作 系 统 不 会 提供 
任何 文件 结构 ， 而 是 预 留 了 一 块 磁盘 区 域 用 于 存放 应 用 程序 所 提供 的 自 创 的 文件 结构 。 此 类 
原始 存 取 能 够 派 上 用 场 的 实际 例子 包括 操作 系统 本 身 的 分 页 存储 和 数据 库 系 统 。 
12.4 空闲 空间 管理 

操作 系统 把 文件 和 目录 存放 在 磁盘 的 盘 块 里 。 为 了 能 够 做 到 这 一 点 ， 操 作 系 统 就 需要 
记录 和 监测 还 有 哪些 盘 块 尚未 被 使 用 。 通 常 可 采用 两 种 方法 来 记录 磁盘 的 空闲 空间 ( free 
space) : 链表 法 (linked list) 和 位 图 法 (bitmap)。 最 初 ， 文 件 系统 记录 的 是 磁盘 上 可 被 访问 
的 最 小 的 块 空间 ， 即 扇 区 ( sector)。 伴 随 磁盘 空间 的 扩充 ,人 磁 盘 上 用 于 指向 扇 区 的 指针 的 大 
小 也 变 得 越 来 越 大 。 例 如 ， 现 代 的 磁盘 驱动 右 如 今 正 迈 向 万 亿 字 节 (TB) 的 空间 范围 。 任 何 

一 个 超过 2TB 的 驱动 器 都 要 求 相 应 指针 应 大 于 4B( 译 者 注 ; 其 实 应 为 大 于 5B)。 当 然 ， 起 
初 为 软盘 设计 的 文件 系统 并 没有 用 到 那么 大 的 指针 。 因 此 ， 当 磁盘 空间 膨胀 过 大 使 文件 系统 
相关 指针 不 再 适用 时 ， 一 种 简单 的 解决 方案 就 是 一 次 分 配 两 个 以 上 的 扇 区 。 简 单 地 按 两 个 肩 
区 一 起 进行 分 配 会 使 对 应 指针 的 涵盖 范围 翻 倍 。 这 一 过 程 不 断 延 伸 ， 某 些 情况 下 文件 系统 甚 
至 会 扩展 到 一 次 分 配 多 达 64 个 扇 区 ， 尽 管 4KB 大 小 的 分 配 要 更 为 常见 些 。 由 此 产生 的 结构 
被 称 为 一 个 盘 块 (block)， 有 时 也 被 称 为 一 个 簇 ( cluster)。 这 种 方法 看 起 来 很 不 错 ， 但 相关 
机 制 存 在 的 一 个 问题 是 ， 如 果 存 放 在 磁盘 上 的 数据 包含 有 许多 小 文件 ， 就 会 很 浪费 空间 。 例 
如 ， 大 部 分 的 脚本 (或 批 处 理 ) 文件 往往 仅仅 只 有 几 行 文本 ， 它 们 都 很 少 能 填 满 一 个 扇 区 ， 
更 不 用 说 64 个 遍 区 了 ! 不 过 话 又 说 回来 ， 既 然 这 种 一 次 性 分 配 多 个 扇 区 的 技术 非常 普遍， 
所 以 在 这 一 章 中 ,我们 通常 会 说 分 配 一 个 盘 块 ， 而 不 是 分 配 一 个 扁 区 。 


12.4.1 链表 式 空 闲 空间 监测 


监测 空闲 空间 的 方法 之 一 就 是 把 所 有 的 空闲 盘 块 放 到 一 个 链表 中 。 图 12-9 显示 了 某 磁 
盘 驱 动 器 上 的 盘 块 分 布 情况 。 操 作 系统 必须 要 记录 和 掌控 链表 中 的 第 一 个 盘 块 ， 而 每 一 个 空 
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闲 盘 块 都 将 包含 一 个 指针 指向 下 一 个 空闲 盘 块 。 注 意 ， 链 表 是 无 序 的 。 或 许 我 们 一 开始 建立 
的 是 一 个 有 序 的 链表 ,但 是 ， 当 有 应 用 程序 释放 一 个 盘 块 时 ,我 们 往往 希望 能 够 把 它 放 在 链 
表 的 前 端 ， 这 样 我 们 就 不 需要 改变 磁盘 上 的 其 他 任何 扇 区 去 指向 这 个 刚刚 被 释放 的 盘 块 了 。 
我 们 会 提取 指向 当前 链表 首部 盘 块 的 指针 ,并 把 它 放 和 刚刚 被 释放 的 盘 块 中 。 我 们 将 会 对 该 
盘 块 中 实际 包含 下 一 个 空闲 盘 块 指针 的 扇 区 执行 磁盘 写 操作 ， 同 时 把 这 个 刚刚 被 释放 的 盘 块 
作为 链表 的 第 一 个 盘 块 。 
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图 12-9 空闲 空间 链 


这 种 机 制 好 的 方面 在 于 ， 其 要 求 用 来 记录 空闲 空间 的 唯一 的 “额外 ”空间 开销 仅仅 为 唯 
一 的 一 个 指向 链表 首部 的 指针 ， 所 有 其 余 的 指针 都 隐匿 和 存放 于 空闲 空间 自身 内 部 。 这 种 机 
制 不 好 的 方面 则 在 于 ， 其 通常 很 难 分 配 到 连续 的 盘 块 空间 ， 所 以 ,如果 应 用 程序 想 要 拥有 磁 
盘 驱 动 器 上 的 连续 的 数据 盘 块 ， 这 就 算 不 上 一 种 好 的 可 以 采用 的 机 制 。 这 种 机 制 存 在 的 另外 
一 个 问题 是 ， 为 了 得 到 下 一 个 空闲 盘 块 的 地 址 ， 操 作 系 统 会 因为 某 空 闲 盘 块 包含 指向 下 一 个 
空闲 盘 块 的 指针 而 必须 首先 要 读 取 该 空闲 盘 块 。 在 下 一 节 中 ,我 们 将 会 讨论 解决 这 个 问题 的 
二 些 方法 。 


12.4.2 ”改进 的 链表 法 


为 了 更 好 地 发 挥 作用 ， 链 表 需 要 通过 某 种 途径 ， 可 以 让 我 们 无 须 逐 个 读 取 每 个 扇 区 ， 
就 可 以 使 用 链表 和 找到 下 一 个 可 用 的 空闲 扇 区 。 有 若干 种 方法 都 可 以 做 到 这 一 点 。 分 组 
( grouping) 和 索引 (indexing) 是 两 种 常见 的 方法 。 基 于 索引 机 制 ， 我 们 只 需 把 一 群 关于 空 
闲 空间 的 指针 存放 到 单一 的 盘 块 中 。 假 设 一 个 盘 块 就 是 一 个 扇 区 ， 即 512 字 节 ， 而 我 们 的 
指针 是 32 位 ， 即 4 字 节 ,那么 ,一 个 盘 块 就 可 以 存放 128 个 指针 。 因 此 ， 链 首 的 盘 块 ， 将 
不 再 仅仅 是 指向 下 一 个 空闲 盘 块 ， 而 是 指向 接 下 来 的 128 个 空闲 盘 块 。 第 一 个 盘 块 被 称 为 
索引 盘 块 (index block)。 相 关 示 例如 图 12-10 所 示 。 我 们 可 以 使 用 由 第 一 个 索引 盘 块 所 指 
向 的 所 有 的 盘 块 ， 然 后 再 使 用 索引 盘 块 本 身 。 被 指向 的 最 后 一 个 盘 块 则 应 当 是 另外 的 一 个 索 
引 盘 块 。 当 我 们 使 用 每 一 个 数据 盘 块 时 ， 我 们 需要 将 索引 盘 块 的 内 容 〈 译 者 注 : 其 实 索引 盘 
块 会 在 内 存 建 立 其 内 容 的 副本 ， 即 对 应 所 谓 的 内 存 索引 块 ， 系 统 运行 过 程 中 ， 通 常 基于 内 存 
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索引 块 来 进行 空闲 空间 的 监测 管理 ， 且 内 存 索 引 块 与 磁盘 索引 盘 块 的 内 容 应 保持 一 致 。 此 
处 应 指 的 是 内 存 索 引 块 的 内 容 。) 写 回 到 磁盘 ,这样 索引 盘 块 内 容 就 会 与 现状 保持 一 致 。 不 
过 ， 这 里 往往 会 采取 一 些 细微 的 优化 处 理 ， 即 常常 会 同时 取出 若干 个 盘 块 指针 ， 然 后 一 次 性 
重新 写 回 索引 盘 块 中 ， 并 暂时 将 这 些 盘 块 指针 存放 在 内 存 中 。 这 一 过 程 就 是 所 谓 的 预 分 配 
(preallocation)。 这 种 技术 可 以 用 于 许多 空闲 空间 记录 监测 机 制 中 ， 以 便 将 磁盘 上 数据 的 更 
新 减少 到 最 低 程 度 。 当 然 ， 存 在 系统 失败 的 某 种 可 能 ， 也 就 是 说 ， 磁 盘 上 的 信息 可 能 显示 某 
些 盘 块 正 在 被 使 用 ， 而 其 实 它们 并 未 被 使 用 。 让 系统 决策 失败 是 一 种 概率 相当 低 的 事件 。 但 
如 果 系 统 确实 发 生 了 判断 失误 ， 我 们 失去 监控 的 那 几 个 盘 块 也 通常 是 可 用 空间 的 很 小 的 一 部 
分 。 无 论 是 文件 数据 还 是 元 数据 都 不 会 存在 丢失 的 问题 。 同 时 ， 我 们 还 会 有 拥有 文件 系统 检 
查 功能 的 实用 例 程 ， 将 会 以 扫描 文件 系统 为 代价 来 恢复 那些 丢失 的 盘 块 。 因 此 ， 我 们 不 用 担 
心 元 数据 中 可 能 丧失 一 致 性 的 问题 。 

空闲 空间 链 首部 
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图 12-10 基于 索引 机 制 的 空闲 空间 链 


分 组 法 是 另外 一 种 能 够 改进 链表 式 空闲 空间 监测 的 机 制 。 该 项 技术 中 ， 操 作 系 统 会 把 握 
每 一 次 机 会 来 限定 链表 中 的 两 个 或 多 个 盘 块 是 相 邻 的 。 如 果 每 次 能 以 多 个 盘 块 而 非 唯一 一 个 
盘 块 的 方式 进行 文件 空间 的 分 配 ， 那 样 就 很 容易 能 够 做 到 。 在 这 种 情况 下 ， 对 应 组 中 的 第 一 
个 盘 块 不 仅仅 会 包含 一 个 指向 下 一 个 空闲 盘 块 的 指针 ， 而 且 还 会 说 明 链 表 中 有 多 少 后 续 的 盘 
块 是 彼此 相 邻 的 。 相 关机 制 示例 如 图 12-11 所 示 。 这 将 允许 分 配 机 制 在 某 些 时 候 能 够 更 容易 
地 以 连续 盘 块 的 方式 进行 分 配 。 与 此 同时 ， 该 第 一 个 盘 块 读 取 之 后 ， 无 须 再 次 读 取 磁 盘 ， 就 
可 以 把 相应 组 中 的 其 余 盘 块 也 分 配 出 去 。 


12.4.3 ”位 图 式 空闲 空间 监测 

另外 一 种 监测 空闲 空间 的 方法 是 通过 一 个 位 图 ， 其 中 文件 系统 中 的 每 一 个 盘 块 的 使 用 情 
况 都 用 长 长 的 串 中 的 唯一 的 一 位 来 表征 。 进 一 步 说 ， 如 果 对 应 的 位 设 定 为 这 样 ， 那 么 相应 的 
盘 块 就 是 空闲 的 。 而 如 果 对 应 的 位 设 定 为 那样 ， 那 么 相应 的 盘 块 就 是 已 被 使 用 的 。 位 “1” 
是 指示 相应 的 盘 块 为 空闲 的 ， 还 是 指示 相应 的 盘 块 已 被 使 用 ， 主 要 取决 于 计算 机 的 指令 集 。 
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我 们 很 快 将 会 阐明 这 一 点 。 回 想 一 下 ， 链 表 机 制 存在 的 问题 之 一 在 于 其 难以 分 配 到 多 个 连续 
的 盘 块 。 而 借助 于 位 图 来 做 到 这 一 点 ,将 比 通过 链表 机 制 要 简单 和 容易 许多 。 其 只 需要 查找 
到 一 串 满足 空间 大 小 要 求 的 连续 的 二 进 制 位 即 可 ,具体 体现 为 一 种 搜索 获取 连续 盘 块 的 扫描 
人 处理， 并 且 我 们 希望 有 关 扫 描 过 程 可 以 高 效 地 执行 。 计 算 机 的 指令 集 可 能 是 查找 一 串 0 比 查 
找 一 串 1 更 高 效 ， 也 可 能 是 相反 的 情况 。 这 些 也 正 是 赋予 了 “位 “1” 究 竟 是 表示 空闲 盘 块 
还 是 表示 被 占用 盘 块 ”的 决定 如 此 之 重要 的 唯一 的 考量 所 在 。 位 图 式 空闲 空间 监测 示例 如 
图 12-12 所 示 。 





链表 结束 标记 小 





图 12-11 基于 分 组 的 空闲 空间 链 
“1” 表 示 对 应 的 和 次 忆 被 上 用 
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12-12 位 图 式 空闲 空间 监测 示例 


注意 ， 相 对 于 链表 机 制 而 言 ， 使 用 位 图 来 监测 记录 可 用 的 空闲 空间 会 消耗 我 们 更 多 的 内 
存 。 我 们 需要 在 内 存 中 存放 位 图 的 一 部 分 。 多 数 可 能 的 情况 是 ， 我 们 会 保存 一 个 完整 的 盘 块 
的 内 容 ， 因 为 那样 将 更 容易 实施 读 取 操作 。 而 使 用 链表 ， 我 们 仅 需 存放 一 个 指针 一 一 如 果 我 
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们 实施 盘 块 预 分 配 策略 ,那么 可 能 会 有 更 多 的 一 些 指针 。 尽 管 如 此 ， 现 在 的 内 存 成 本 已 经 非 
常 低 了 ， 而 且 还 在 不 断 地 往 下 降 ， 所 以 这 可 能 并 不 是 一 项 值得 特别 关注 的 考量 因素 。 当 我 们 
分 配 盘 块 的 时 候 ， 我们 确实 需要 更 新 位 图 的 磁盘 副本 。 但 是 ,我 们 也 可 以 使 用 前 面 链 表 式 监 
测 机 制 中 所 讨论 的 预 分 配 技 术 。 男 外 ， 在 我 们 真正 使 用 盘 块 空间 之 前 ， 需 要 更 新 映射 关系 ， 
这 是 非常 重要 的 。 如 果 我 们 没有 及 时 地 更 新 ， 那么 我 们 将 会 遭遇 到 “一 个 盘 块 分 配给 多 个 文 
件 ” 的 风险 。 那 样 情况 就 会 变 得 很 糟糕 。 

位 图 不 仅 会 耗 用 更 多 的 内 存 空间 ， 也 会 占用 更 多 的 磁盘 空间 。 同 时 ， 位 图 还 必须 存放 在 
磁盘 上 的 一 个 专用 的 地 方 ， 相 应 的 位 置 不 能 用 来 进行 数据 存储 。 而 在 链表 机 制 中 ， 指 针 是 存 
放 在 空闲 盘 块 自身 的 空间 里 的 。 尽 管 如 此 ,我们 在 这 里 再 次 强调 ， 磁 盘 空 间 的 成 本 要 相对 低 
廉 且 其 价格 还 在 继续 不 断 地 往 下 降 ， 因 此 在 现在 看 来 ， 空 间 开 销 和 成 本 可 能 并 非 主 要 的 考虑 
因素 ， 虽 然 其 曾经 确实 如 此 。 

还 有 一 种 用 于 监测 空闲 空间 的 更 常见 的 机 制 ， 不 过 其 仅仅 是 在 文件 分 配 表 结构 中 用 于 把 
文件 的 各 个 盘 块 链接 到 一 起 的 相关 机 制 的 副 产 物 ， 所 以 我 们 将 在 对 应 的 标题 下 再 做 进一步 具 
体 的 讨论 。 


12.5 文件 分 配 


关于 文件 系统 ， 另 外 一 项 主要 的 设计 决策 是 关于 文件 自身 如 何在 磁盘 驱动 器 上 进行 组 
织 。 操 作 系 统 通过 应 用 程序 接口 呈现 给 用 户 的 抽象 ， 在 一 定 程度 上 决定 了 操作 系统 可 以 使 用 
的 组 织 类 型 。 主 要 有 三 种 机 制 可 用 于 给 文件 实施 空间 的 分 配 ， 具 体 包括 连续 分 配 、 链 接 分 配 
以 及 索引 分 配 机 制 。 注 意 ， 一 种 操作 系统 并 不 一 定 仅仅 使 用 其 中 的 一 种 文件 分 配 机 制 。 相 
反 ， 一 些 操 作 系统 往往 支持 多 种 类 型 的 文件 分 配 。 可 以 确定 无 疑 和 必须 做 到 的 是 ， 操 作 系 
统 应 当 提 供 相应 的 应 用 程序 接口 支持 有 关 类 型 的 分 配 请 求 ， 并 对 空闲 空间 实现 正确 无 误 地 
监测 。 


12.5.1 连续 分 配 


连续 分 配 ( contiguous allocation) 意味 着 分 配给 一 个 文件 的 相应 盘 块 的 编号 ， 共 同 构 
成 一 个 严格 地 按 1 进行 递增 的 序列 。 例 如 ， 在 图 12-13 中 ， 我 们 可 以 看 到 File B 占据 了 
1000 一 1799 的 连续 盘 块 。 这 些 盘 块 并 不 一 定 开始 于 磁道 边界 的 位 置 ， 而 仅仅 是 在 编号 方案 
中 是 相 邻 的 。 关 于 文件 空间 分 配 的 这 种 方法 具有 某 些 方面 的 明显 的 优势 。 首 先 ， 只 需要 很 少 
的 信息 就 可 以 找到 所 有 的 数据 ， 而 所 需 的 一 切 仅仅 是 第 一 个 盘 块 的 扇 区 地 址 以 及 以 盘 块 数 表 
示 的 文件 的 大 小 。 这 种 分 配方 法 会 使 数据 的 随机 存 取 实现 起 来 非常 简单 ， 相 关 确 切 机 制 会 根 
据 操作 系统 应 用 程序 接口 和 被 分 配 的 盘 块 的 大 小 而 有 所 变化 。 例 如 ， 在 一 些 操 作 系 统 中 ， 应 
用 程序 接口 常常 要 求 应 用 程序 向 系统 传人 关于 文件 读 操作 开始 位 置 的 一 个 偏 移 量 (用 字 节 数 
来 表示 ) 以 及 要 读 取 的 数据 的 长 度 (通常 是 扇 区 大 小 的 若干 倍 )。 在 这 种 情况 下 ， 相 应 的 存 
取 机 制 只 需 把 字 节 偏 移 量 除 以 盘 块 的 大 小 ， 再 将 其 加 上 文件 的 第 一 个 盘 块 的 起 始 扇 区 地 址 就 
可 以 展开 具体 的 存 取 操作 。 当 然 ， 顺 序 存 取 更 是 小 事 一 桩 ， 不 值 一 提 。 就 像 上 面 所 提 到 的 那 
样 ， 如 果 采 用 位 图 式 空闲 空间 监测 机 制 ， 那 么 分 配 连 续 的 空间 毫 不 费力 ， 所 需 完 成 的 工作 只 
不 过 是 在 位 图 中 查找 到 表征 为 空闲 盘 块 的 一 个 连续 的 位 串 即 可 。 采用 链表 式 空闲 空间 监测 机 
制 ， 连 续 分 配 则 会 很 不 切实 际 ， 尽 管 从 技术 上 而 言 并 非 不 可 能 ， 而 我 们 所 描述 的 分 组 机 制 或 
许 在 这 一 方面 会 有 所 帮助 。 
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图 12-13 连续 的 文件 分 配 示例 


连续 分 配 有 一 个 问题 ， 就 是 一 旦 一 个 文件 被 分 配 好 了 ， 要 想 让 该 文件 变 得 大 些 就 困难 了 ， 
因为 很 有 可 能 其 他 的 某 个 文件 刚好 分 配 在 我 们 想 要 变 大 的 那个 文件 之 后 。 例 如 ， 在 图 12-13 
中 ， 要 想 不 动 File B 是 不 可 能 把 File A 变 大 的 。 为 了 避免 这 个 问题 ， 编 程 人 员 往 往 会 倾向 于 
为 文件 分 配 比 其 当前 数据 需求 要 多 的 存储 空间 。 那 样 ， 在 文件 ( 译 者 注 : 这 里 指 文件 空间 ) 
需要 变 大 之 前 ， 相 应 文件 ( 译 者 注 : 这 里 指 文件 数据 或 文件 内 容 ) 是 可 以 扩充 一 段 时 间 的 。 
例如 ， 编 程 人 员 可 能 知道 系统 现在 拥有 100 条 记录 ， 而 通常 情况 下 每 个 月 会 再 增加 两 条 记 
录 。 于 是 ， 可 以 使 文件 分 配 得 到 能 够 容纳 130 条 记录 的 空间 ， 从 而 保证 文件 可 以 正常 运转 大 
致 超过 两 年 的 时 间 ， 并 且 相 关 空 间 不 会 被 填 满 ， 同 时 也 不 需要 重新 分 配 空间 。 对 于 为 文件 多 
分 配 的 、 其 暂时 用 不 到 或 永远 用 不 到 而 又 无 法 分 配给 其 他 文件 加 以 利用 的 空间 ， 我 们 称 之 为 
程序 员 碎 片 ( programmer fragmentation)。 遗 憾 的 是 ， 这 是 对 存储 空间 的 浪费 和 挥霍 。 如 果 
磁盘 驱动 器 上 有 足够 的 空闲 空间 ， 去 分 配给 文件 的 另外 一 个 副本 ， 那 么 关于 文件 变 大 的 相关 
操作 还 是 相当 简单 的 。 但是， 如 果 文 件 很 大 ， 那么 相关 操作 就 可 能 是 非常 耗 时 的 。 如 果 没 有 
足够 的 空间 来 分 配给 新 的 副本 ， 那 么 对 应 文件 就 必须 要 御 载 到 三 级 存储 设备 上 ， 旧 的 文件 被 
删除 掉 ， 其 他 的 文件 被 搬 来 搬 去 ， 以 便 为 相应 的 新 文件 腾 出 足够 大 的 连续 的 空间 来 ， 然 后 再 
为 该 新 文件 分 配 空间 ， 最 后 将 数据 加 载 到 新 文件 里 。 

这 一 过 程 的 笨拙 引发 了 连续 分 配 机 制 的 一 个 变革 一 一 对 扩展 盘 块 区 的 使 用 。 在 该 方案 
中 ,一 个 文件 不 再 局 限于 唯一 一 次 的 连续 分 配 。 初 始 分 配 得 到 的 是 一 个 连续 的 盘 块 区 ,但 
是 ， 如 果 该 盘 块 区 填 满 了 ， 将 不 再 是 去 做 一 个 新 的 副本 ， 而 是 直接 进行 第 二 次 的 分 配 ， 且 该 
分 配 得 到 的 盘 块 区 ( 即 所 谓 的 扩展 盘 块 区 ) 不 一 定 非 得 与 初始 分 配 得 到 的 盘 块 区 相连 续 。 第 
二 次 分 配 得 到 的 扩展 盘 块 区 自身 也 是 连续 的 ， 不 过 其 通常 要 小 于 初始 分 配 得 到 的 盘 块 区 〈 即 
所 谓 的 主 盘 块 区 )。 还 可 以 进行 第 三 次 、 第 四 次 的 分 配 ， 但 此 类 再 次 分 配 的 次 数 一 般 应 在 某 
个 不 多 的 限度 范围 之 内 一 一 如 可 设 定 为 最 多 不 超过 16 次 左右 。 需 要 指出 的 是 ， 这 时 的 对 随 
机 存 取 的 文件 地 址 的 计算 就 要 有 点 复杂 了 。 对 于 单一 连续 的 文件 而 言 ， 我 们 拿 到 对 应 记录 或 
字 节 偏 移 量 ， 就 可 以 计算 出 存 取 位 置 距离 文件 首部 盘 块 的 偏 移 量 。 而 现在 我 们 还 需要 拥有 一 
张 表 格 ， 该 表格 填 有 各 扩展 盘 块 区 的 起 始 逻 辑 地 址 、 起 始 物理 地 址 以 及 相应 的 大 小 。 我 们 计 
算出 偏 移 量 ， 然 后 查找 该 表格 ， 从 中 找到 包含 该 偏 移 量 的 那个 扩展 盘 块 区 ， 进 而 计算 出 相对 
于 该 扩展 盘 块 区 开始 位 置 的 偏 移 量 。 相 比 于 硬盘 的 速度 ， 这 还 是 微不足道 的 。 扩 展 盘 块 区 
并 不 是 一 种 特别 新 的 解决 方案 例如， 至 少 早 在 20 世纪 60 年 代 末 期 由 IBM 公司 开发 的 
OS/360 系统 中 已 经 使 用 过 这 种 方法 。 

连续 分 配方 案 存 在 空间 浪费 的 几 种 情况 。 第 一 种 情况 是 由 我 们 可 以 访问 的 最 小 空间 部 


荔 12 间 艾 件 条 统 类 础 225 


分 是 扇 区 的 事实 所 造成 的 ， 而 且 我 们 经 常 是 以 盘 块 而 非 肩 区 来 进行 分 配 和 监测 空间 的 ， 从 而 
进一步 加 剧 了 相关 问题 。 因 此 ， 我 们 可 能 会 按 由 4 个 扇 区 组 成 的 盘 块 来 实施 分 配 ， 但 大 多 数 
情况 下 ， 我 们 并 不 需要 此 类 分 配 得 到 的 全 部 空间 。 有 时 ， 我 们 会 正好 填 满 最 后 一 个 盘 块 ， 但 
有 时 我 们 仅仅 需要 最 后 一 个 盘 块 的 一 个 字 节 而 已 ， 于 是 平均 下 来 我 们 只 使 用 了 其 中 的 一 半空 
间 。 这 种 由 分 配 粒 度 所 造成 的 尚未 利用 的 空间 被 称 为 内 部 碎片 (internal fragmentation)。 我 
们 在 第 10 章 中 讨论 主 存 分 配 的 时 候 ， 曾 遇 到 过 完全 相同 的 问题 。 除 非 我 们 有 很 多 非常 小 的 
文件 ， 和 否则 ， 以 现在 的 磁盘 驱动 器 的 空间 大 小 和 成 本 来 讲 ， 磁 盘 驱 动 器 上 的 内 部 碎片 并 不 总 
会 被 摆 到 非常 显要 的 重视 层级 上 来 。 

更 为 紧要 的 是 外 部 碎片 化 (external fragmentation) 的 问题 。 同 样 ， 这 一 问题 在 关于 内 存 
管理 的 第 10 章 曾 进行 过 讨论 。 当 我 们 接近 于 填 满 磁盘 的 时 候 ， 外 部 碎片 这 个 问题 就 会 凸现 
出 来 。 伴 随 我 们 对 连续 文件 的 分 配 和 释放 ， 我 们 往往 会 趋向 于 把 整个 空闲 空间 切割 开 来 ， 因 
为 我 们 总 是 从 较 大 的 空闲 空间 中 取出 一 片 连续 的 空闲 空间 来 。 直 到 最 后 ， 残 留 的 空闲 连续 空 
间 都 变 得 太 小 而 全 都 无 法 独立 满足 我 们 想 要 进行 的 下 一 次 分 配 需求 ， 即 使 这 时 空闲 空间 的 总 
量 能 够 满足 分 配 需求 ， 我 们 也 只 能 望 洋 兴 叹 。 例 如 ， 在 图 12-13 中 ， 根 据 图 中 显示 的 空间 大 
小 ,我 们 大 概 还 有 约 2000 个 盘 块 大 小 的 空间 ,但 是 由 于 该 空闲 空间 被 划分 为 两 个 部 分 ， 所 
以 我 们 就 不 能 够 分 配给 一 个 那么 大 的 文件 ， 尽 管 我 们 拥有 是 够 多 的 空 闪 空间 可 以 分 配给 这 样 
的 文件 。 此 类 问题 的 解决 方法 有 些 麻烦 ， 称 之 为 碎片 整理 ( defragmentation )。 其 基本 思想 
是 把 一 些 文件 移 到 能 够 容 下 它们 的 残留 空间 里 ， 从 而 腾挪 出 较 大 的 连续 空闲 空间 来 满足 我 们 
想 要 分 配 的 文件 。 该 项 技术 在 第 10 章 中 已 进行 了 非常 详尽 全 面 的 描述 ， 故 而 在 此 不 再 袭 述 。 
第 三 种 类 型 的 “碎片 ”是 在 介绍 程序 员 会 为 文件 分 配 多 于 其 真正 所 需 大 小 的 空间 的 时 候 曾 经 
讨论 过 的 程序 员 碎片 。 不 过 ， 就 程序 员 碎 片 而 言 ， 与 其 说 它 是 一 种 技术 问题 ， 倒 不 如 说 它 是 
一 种 社会 问题 。 但 是 ， 该 问题 是 因为 很 难 使 一 个 连续 的 文件 变 大 而 演变 出 来 的 ， 所 以 需要 被 
提 到 。 


12.5.2 ”链接 分 配 


第 二 种 常见 的 文件 分 配 机 制 是 链表 。 这 种 机 制 就 像 主 存 中 的 链表 结构 一 样 ， 不 过 这 里 链 
接 的 元 素 总 是 大 小 相同 的 ， 即 均 为 一 个 盘 块 的 大 小 。 每 一 个 盘 块 将 包含 其 所 在 同一 文件 的 下 
一 盘 块 的 起 始 扇 区 地 址 。 于 是 ， 这 种 链接 机 制 的 缺点 之 一 就 是 每 一 盘 块 都 会 消耗 一 部 分 空间 
来 存放 链接 指针 。 在 最 坏 的 情况 下 ， 我 们 拥有 一 个 可 能 为 512 字 节 大 小 的 单独 的 扇 区 ， 而 一 
个 指针 可 能 占用 了 4 字 节 ， 由 此 推算 ,空间 浪费 额度 还 不 到 1%。 如 果盘 块 大 于 一 个 扇 区 ， 
那么 花费 在 链接 指针 上 的 开销 会 更 少 。 图 12-14 给 出 了 此 类 结构 的 一 个 示例 。 

这 种 链表 分 配 机 制 还 有 另外 一 个 缺点 ， 即 针对 此 类 文件 实现 随机 存 取 方 法 有 些 困 难 。 尽 
管 如 此 ， 并 非 没有 可 能 。 认 真 分 析 一 下 图 12-14 中 给 定 的 文件 ， 针 对 相关 文件 提供 随机 访问 
所 需 做 的 全 部 事情 就 是 把 连续 分 配 一 节 所 讨论 的 扩展 盘 块 区 的 思想 进一步 拓展 开 来 。 我 们 
只 是 需要 在 内 存 中 建立 一 张 表 ， 以 给 定 对 应 文件 分 配 得 到 的 每 个 盘 块 的 起 始 位 置 的 指针 。 虽 
然 ， 对 于 一 个 很 大 的 文件 ， 这 张 表 可 能 比较 大 ， 而 且 循 着 整个 链 去 构建 这 张 表 可 能 会 花费 一 
些 时 间 ， 但 是 在 大 多 数 情况 下 ， 这 却 可 能 是 一 种 切实 可 行 的 解决 方案 。 如 果 文 件 很 长 时 间 都 
不 会 打开 ， 那 么 建立 和 存储 这 张 表 所 需 的 空间 和 时 间 开 销 可 能 有 些 过 高 。 但 如 果 要 对 文件 进 
行 大 量 的 随机 访问 ， 而 且 该 文件 也 不 是 太 大 ， 那 么 这 种 方案 还 是 蛮 实 用 的 。 还 有 ， 当 文件 第 
一 次 被 打开 时 ， 我 们 未 必 一 定 需 要 循 着 整个 链 走 上 一 遍 。 只 有 当 对 记录 的 引用 使 我 们 需要 访 
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问 文件 中 我 们 尚未 读 取 对 应 指针 的 部 分 的 时 候 ， 我 们 才 可 能 循 着 链 来 填写 这 张 表 格 。 
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图 12-14 ”链表 式 文件 分 配方 法 示例 


我 们 可 以 看 到 ， 在 图 12-14 中 ， 描 述 链接 文件 的 目录 项 包含 有 指向 文件 起 始 盘 块 的 一 个 
指针 以 及 用 盘 块 数 表示 的 文件 长 度 ， 同 时 还 有 一 个 指向 链表 中 最 后 一 个 盘 块 的 指针 。 告 一 
看 ,存储 指向 文件 末尾 的 指针 似乎 没有 什么 必要 ， 而 且 事 实 上 也 没有 必要 ， 因 为 我 们 总 可 以 
沿 着 链表 中 的 指针 找到 末尾 。 但 是 ， 这 样 设置 却 具有 两 个 非常 实际 的 理由 。 第 一 个 理由 是 ， 
有 时 我 们 想 以 “添加 ”模式 来 打开 文件 一 一 也 就 是 说 ,我 们 正好 想 把 数据 添加 到 文件 的 末 

276| 尾 。 日 志文 件 就 是 践 行 这 种 操作 的 一 个 很 好 的 例子 。 这 样 设置 ， 总 能 够 更 快捷 地 直接 到 达 链 
表 的 末尾 。 第 二 个 理由 与 元 余 有 关 。 对 于 文件 系统 的 元 数据 而 言 ， 有 一 些 宛 余 总 是 好 的 。 那 
样 ， 当 发 生 问题 时 ， 我 们 运行 来 修复 文件 系统 的 实用 例 程 就 会 有 更 加 精确 的 指标 ， 从 而 可 以 
规划 出 正确 的 行动 方案 。 

关于 链接 文件 ， 其 好 的 方面 在 于 ， 我 们 不 用 去 担心 程序 员 碎片 问题 。 因 为 扩展 一 个 链接 
文件 是 非常 简单 的 事情 ， 没 有 任何 压力 一 开始 就 得 去 为 文件 分 配 太 多 的 初始 空间 。 

在 关于 连续 文件 分 配 的 一 节 ， 我 们 曾经 讨论 过 ， 当 有 足够 的 空闲 空间 可 以 满足 分 配 需求 
但 可 用 空间 并 不 连续 的 情况 下 ， 就 需要 对 空间 展开 紧凑 处 理 。 我 们 还 提 到 相关 过 程 有 时 被 称 
作 和 碎片 整合 。 或 许 有 些 令 人 惊讶 ， 链 接 文件 也 面临 着 所 说 的 结构 性 问题 ， 而 碎片 整合 这 个 术 
语 应 用 到 这 个 问题 可 能 会 更 合适 些 。 链 接 文件 的 结构 可 以 看 成 是 采用 连续 的 扩展 盘 块 区 的 极 
端 情况 ， 也 就 是 说 ， 其 扩展 盘 块 区 也 就 一 个 盘 块 的 大 小 。 链 接 文件 所 存在 的 问题 是 ， 随 着 文 
件 长 度 的 增 大 ,“ 下 一 可 用 的 ” 盘 块 可 能 位 于 磁盘 上 的 任何 地 方 。 为 此 ， 链 表 就 可 能 跟着 文 
件 变 大 时 可 用 盘 块 的 位 置 而 在 磁盘 上 来 来 回回 跳 来 跳 去 。 此 类 极端 的 分 配 示 例如 图 12-15 所 
示 。 如 果 让 一 道 完成 很 多 输入 /输出 操作 但 却 没 有 多 少 计 算 处 理 操作 的 程序 来 处 理 这 样 的 文 
件 ， 相 关 开销 可 能 会 很 大 。 重 新 整理 所 有 的 文件 ， 从 而 使 分 配给 每 个 文件 的 盘 块 是 有 序 和 连 
续 的 ， 这 一 过 程 称 为 碎片 整合 。 碎 片 整合 可 以 有 效 地 提高 文件 处 理 的 速度 。 就 像 早 先 所 提 到 
的 ， 某 些 系统 往往 同时 支持 连续 文件 分 配 和 链接 分 配 。 许 多 现代 的 操作 系统 一 般 都 支持 这 两 
种 类 型 的 文件 分 配 ， 所 以 其 结果 是 它们 既 有 外 部 碎片 的 问题 ， 也 有 随机 链表 的 问题 。 因 此 ， 
在 此 类 操作 系统 中 ， 通 过 碎片 整合 来 应 对 相关 这 两 个 问题 都 可 以 发 挥 一 定 的 作用 。 
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链表 结束 标记 下 


图 12-15 碎片 化 文件 示例 


12.5.3 索引 分 配 

就 像 空闲 空间 监测 可 以 采用 索引 方法 一 样 ， 文 件 结构 的 记录 和 描述 也 可 以 采用 一 种 类 
似 的 机 制 来 实现 。 从 最 简单 的 观点 来 看 ， 索 引文 件 结构 有 点 像 一 个 链表 ， 只 是 我 们 分 配 了 一 
个 单独 的 索引 盘 块 来 专门 存放 指针 ， 而 不 是 将 指针 分 散 放置 在 每 一 个 数据 盘 块 中 ， 相 应 的 分 
配方 式 称 为 索引 分 配 。 图 12-16 就 举例 说 明了 某 文件 〈 例 如 File A) 中 的 许多 盘 块 是 通过 一 
个 索引 盘 块 来 存放 和 标示 ， 而 不 是 各 自 单独 分 别 进行 链接 的 。 就 像 索 引 式 空 闲 空间 监测 机 制 
一 样 ， 在 最 简单 的 实现 方案 中 ， 我 们 仅 限于 唯一 的 一 个 索引 盘 块 。 该 限定 将 会 限制 文件 的 大 
小 ， 因 为 盘 块 的 大 小 是 固定 的 ， 于 是 索引 盘 块 能 够 持 有 的 指针 数 只 能 在 受 限 的 最 多 盘 块 号 数 
量 之 内 。 要 想 扩 展 相关 机 制 和 消除 这 个 限制 ， 一 般 可 采用 两 种 方法 。 具 体 而 言 ， 我 们 可 以 使 
用 多 级 索引 ， 类 似 于 我 们 对 内 存 页 表 的 处 理 方式 ， 或 者 我 们 也 可 以 把 索引 盘 块 自身 链接 起 来 
形成 一 个 链表 。 





图 12-16 索引 文件 示例 


279 


228 荔 四 毅 分 ”面向 次 度 的 哥 作 系统 松 念 的 展示 : 文件 系统 布 葵 入 / 葵 幼 


多 级 索引 

对 于 多 级 索引 而 言 ， 我 们 将 会 再 使 用 一 个 盘 块 来 保存 指针 ， 就 像 简单 的 索引 结构 一 
样 。 但 是 在 这 里 ， 第 一 个 索引 盘 块 并 不 会 包含 指向 数据 盘 块 的 指针 ， 而 是 包含 指向 二 级 
索引 盘 块 的 指针 。 在 二 级 索引 盘 块 中 ， 将 会 包含 指向 数据 盘 块 的 指针 。 如 果 一 个 索引 盘 
块 包含 100 个 指针 ， 那么 当 我 们 引入 两 级 索引 结构 后 ， 我 们 可 以 包含 的 数据 盘 块 的 指针 
数 应 是 用 100 乘 以 100。 于 是 我 们 能 够 编 址 和 处 理 一 个 包含 10 000 个 数据 盘 块 的 文件 。 
如 果 这 还 不 够 用 ,我 们 还 可 以 再 引进 一 层 索 引 。 而 每 加 一 层 索 引 ， 能 够 处 理 的 文件 大 小 
将 会 在 原 有 支持 的 文件 空间 大 小 的 基础 上 再 乘 以 100。 于 是 ,三 级 索引 将 容许 文件 包含 
100 万 个 盘 块 。 注 意 , 在 第 一 次 打开 文件 时 ， 我 们 不 一 定 需要 将 整个 索引 盘 块 集 都 读 人 
内 存 。 我 们 可 以 等 到 应 用 程序 试图 访问 某 索 引 盘 块 所 涵盖 的 文件 数据 部 分 的 时 候 ， 再 来 
读 取 对 应 的 索引 盘 块 。 如 果 要 打开 一 个 非常 大 的 文件 并 执行 简短 的 读 取 操作 ， 例 如 在 字 
典 中 查找 一 个 单词 ， 这 一 着 将 会 特别 奏效 。 图 12-17 给 出 了 多 级 索引 文件 组 织 结构 的 一 个 
例子 。 





File C 


图 12-17 多 级 索引 文件 示例 


索引 盘 块 链表 

就 像 空闲 空间 链表 一 样 ， 我 们 可 以 简单 地 将 索引 盘 块 链接 到 一 起 形成 一 个 链 。 于 是 ， 每 
个 索引 盘 块 将 会 少 包 含 一 个 指向 数据 盘 块 的 指针 ， 因 为 我 们 需要 一 个 指针 来 指向 和 访问 下 一 
个 索引 盘 块 。 显 然 ， 对 于 大 多 数 的 盘 块 和 磁盘 大 小 来 说 ， 这 不 可 能 成 为 一 个 影响 严重 的 因 
素 。 图 12-18 给 定 的 文件 采用 的 是 链接 式 索引 结构 的 文件 组 织 方式 ( 译 者 注 : 例如 File A)。 
如 果 要 对 文件 进行 随机 访问 ， 那 么 在 文件 打开 时 ， 这 种 机 制 将 会 要 求 我 们 循 着 索引 盘 块 链 把 
索引 盘 块 读 入 内存 。 当 然 ， 我 们 可 以 推迟 所 有 索引 盘 块 的 读 入 ， 直 到 我 们 需要 时 再 执行 相应 
的 读 取 操 作 。 如 果 对 文件 执行 的 是 顺序 访问 ， 我 们 可 以 在 即将 访问 到 上 一 索引 盘 块 的 最 后 一 
个 数据 盘 块 指针 的 时 候 ， 再 根据 其 中 给 定 的 索引 盘 块 链接 指针 读 人 对 应 的 索引 盘 块 。 
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第 二 个 索引 盘 块 
小 = 链表 结束 标记 


图 12-18 ”基于 索引 盘 块 链表 的 文件 结构 示例 


12.6 小 结 


文件 是 操作 系统 提供 的 一 种 重要 的 抽象 。 早 在 计算 机 出 现 之 前 ， 文 件 就 已 经 在 使 用 了 ， 
所 以 文件 为 大 家 所 熟知 。 程 序 设计 人 员 不 想 去 操心 硬件 的 东西 ， 他 们 想 要 考虑 的 是 数据 的 集 
合 。 在 计算 机 系统 中 ， 数 据 的 集合 就 是 文件 。 在 本 章 中 ,我 们 讨论 了 文件 系统 的 本 质 ， 然 后 
介绍 了 操作 系统 的 文件 系统 的 基本 思想 。 现 代 计 算 机 系统 拥有 很 多 文件 ， 故 而 可 能 需要 组 织 
文件 ， 以 便 我 们 可 以 找到 相关 的 东西 。 我 们 讨论 了 文件 系统 中 的 目录 。 不 同 的 应 用 程序 需要 
不 同 的 存 取 数据 的 方法 ， 因 此 我 们 描述 了 可 以 提供 给 应 用 程序 用 来 存 取 文件 中 的 数据 的 各 式 
各 样 的 方法 。 文 件 系 统 需 要 记录 和 监测 整个 空间 中 有 哪些 空间 当前 是 空闲 的 。 我 们 探索 了 用 
于 监测 这 些 空闲 空间 的 各 种 不 同 的 结构 。 我 们 还 就 文件 自身 结构 的 话题 进行 了 阐述 ， 并 讨论 
了 不 同方 法 的 权衡 问题 。 

在 下 一 章 中 , 我 们 将 会 就 众所周知 的 操作 系统 中 的 几 个 文件 系统 展开 案例 分 析 ， 同 时 还 
会 就 关于 操作 系统 的 文件 系统 的 一 些 其 他 的 话题 展开 讨论 。 
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习题 

12.1 我 们 提 到 过 好 多 东西 可 能 出 现在 文件 目录 中 ,但 有 些 是 很 罕见 的 。 哪 几 样 东西 最 可 能 在 每 种 操 
作 系 统 目 录 结 构 中 都 会 出 现 ? 

12.2 ”对 于 今天 的 系统 来 说 ， 单 级 目录 结构 存在 的 主要 问题 是 什么 ? 

12.3 ”既然 层次 式 目录 结构 允许 具有 相同 名 字 的 多 个 文件 存在 ,那么 ， 为 了 可 以 唯一 地 指定 这 些 文件 ， 
我 们 应 该 如 何 引用 它们 呢 ? 

12.4 什么 类 型 的 问题 促成 了 对 别名 的 使 用 呢 ? 

12.5 为 了 改善 搜索 时 间 效 率 ， 应 该 如 何 优化 目录 内 部 组 织 呢 ? 

12.6 为 什么 操作 系统 通常 会 提供 特殊 的 调用 来 访问 目录 项 呢 ? 

12.7 关于 诸如 erase< 文件 名 > 这 样 的 命令 ， 工 作 目录 会 起 到 什么 样 的 效果 呢 ? 

12.8 如果 通过 顺序 存 取 方 法 来 处 理 一 个 文件 ， 对 于 一 次 读 操作 ， 当 前 记录 指针 会 发 生 什么 样 的 变 
化 呢 ? 

12.9 采用 随机 存 取 的 一 个 应 用 程序 不 能 只 是 请 求 操作 系统 访问 下 一 条 记录 ， 而 总 是 必须 指定 相应 的 
记录 号 。 这 种 说 法 是 否 正确 ? 

12.10 ”对 于 索引 顺序 存 取 来 说 ， 每 条 记录 的 主 关键 字 字 段 必须 包含 唯一 的 键 值 。 这 种 说 法 是 否 正 确 ? 

12.11 原始 存 取 提 供 了 什么 样 的 服务 呢 ? 

12.12 在 文件 系统 中 ， 两 种 基本 的 空闲 空间 记录 监测 机 制 是 什么 ? 

12.13 ”对 于 我 们 介绍 的 空闲 空间 记录 监测 机 制 ， 其 中 的 一 种 机 制 拥有 两 种 宽泛 的 改进 方案 ， 且 其 中 一 
种 改进 方案 引入 了 一 项 其 他 的 改进 措施 。 这 些 改进 对 策 均 致力 于 与 该 空闲 空间 记录 监测 机 制 相 
关联 的 重要 性 能 问题 的 缓解 。 这 里 说 的 是 哪 种 空闲 空间 记录 监测 机 制 ? 我 们 所 关注 的 问题 是 什 
么 呢 ? 

12.14 ”在 前 一 个 问题 中 所 提 到 的 “其 他 的 改进 措施 ”是 一 种 也 可 以 应 用 在 其 他 的 空闲 空间 机 制 及 其 改 
进 方面 的 技术 ， 这 种 技术 具体 指 的 是 什么 呢 ? 

12.15 在 文件 系统 中 ， 用 于 文件 空间 分 配 的 三 种 基本 机 制 是 什么 ? 

12.16 有 一 种 文件 空间 分 配 机 制 对 于 随机 存 取 文件 来 说 是 最 方便 的 ， 它 是 哪 一 种 呢 ? 

12.17 (和 上 题 答案 ) 相同 的 分 配 机制 很 难 增 大 文件 的 长 度 。 这 个 问题 带 来 了 一 个 间接 的 问题 ， 那 么 这 
个 间接 的 问题 是 什么 呢 ? 

12.18 (和 上 题 答案 ) 相同 的 分 配 机 制 很 难 增 大 文件 的 长 度 。 为 此 ， 我 们 描述 了 人 允许 增 大 文件 长 度 的 该 
基本 机 制 的 一 个 变种 。 该 变种 是 什么 样 的 呢 ? 

12.19 ”什么 是 内 部 碎片 ? 为 什么 在 大 多 数 情况 下 内 部 碎片 不 再 是 一 个 问题 了 ? 

12.20 ”什么 是 外 部 碎片 ?对 于 某 些 操作 系统 而 言 ， 为 什么 外 部 碎片 的 问题 比 内 部 碎片 更 厉害 ? 

12.21 我 们 曾 提 到 “程序 员 碎 片 ” 的 问题 ,， 并且 声称 其 中 一 种 文件 分 配 机 制 没有 这 类 问题 。 是 哪 一 种 


12.22 
12.23 
12.24 


时 全 
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文件 分 配 机 制 呢 ? 为 什么 它 不 会 有 程序 员 碎 片 问题 ? 

(和 上 题 答案 ) 相同 的 机 制 存在 一 个 严重 的 缺陷 ， 有 具体 是 什么 呢 ? 

简要 描述 链接 文件 的 碎片 整合 要 做 哪些 事情 。 

由 于 能 够 存储 在 唯一 的 一 个 索引 盘 块 中 的 指针 的 数量 是 有 限 的 ， 所 以 最 简单 的 索引 文件 分 配方 
法 限制 了 文件 的 大 小 。 为 了 突破 这 种 限制 ， 本 书 讨论 了 什么 样 的 两 种 机 制 ? 

对 于 随机 文件 访问 来 说 ， 哪 些 机 制 可 能 会 更 好 地 运作 ? 


第 13 章 | 


Operating Systems: A Spiral Approach 


文件 系统 实例 及 更 多 功能 


13.1 引言 


在 第 12 章 中 ,我 们 阐述 了 文件 系统 的 概念 以 及 文件 系统 是 如 何 融入 操作 系统 中 的 。 
我 们 介绍 了 关于 文件 存储 和 空闲 空间 监测 的 许多 可 能 的 备 选 机 制 ， 而 实际 的 文件 系统 的 设 
计 人 员 必 须 对 系统 将 要 包含 的 机 制 做 出 选择 。 我 们 将 会 看 到 ， 现 代 操 作 系 统 使 用 了 我 们 所 
描述 的 所 有 技术 ,但 是 没有 任何 一 种 操作 系统 是 完全 按照 我 们 所 描述 的 方式 来 使 用 这 些 技 
术 的 。 

在 第 13.2 节 中 ， 我 们 将 会 围绕 现代 操作 系统 中 文件 系统 的 相关 设计 给 出 一 些 案例 研究 。 
在 此 基础 上 ,我 们 将 会 讨论 文件 系统 和 文件 处 理 相 关 的 若干 其 他 主题 。 进 一 步 说 ,我 们 将 在 
第 13.3 节 讨 论 挂 载 一 个 文件 系统 并 将 其 中 的 有 关 信 息 提供 给 应 用 程序 的 基本 原理 ， 而 在 第 
13.4 节 我 们 将 会 剖析 虚拟 文件 系统 和 相关 概念 背后 的 根源 ， 同 时 在 第 13.5 节 我 们 将 会 阐明 
内 存 映射 文件 的 目的 。 通 常情 况 下 ， 操 作 系统 会 提供 大 量 的 实用 程序 以 实现 文件 系统 信息 的 
标准 化 操作 。 为 此 ,我 们 在 第 13.6 节 讨 论 其 中 的 一 些 实用 程序 。 另 外 ， 我 们 在 第 13.7 节 对 
构建 更 可 靠 文件 系统 的 事务 型 文件 系统 技术 ( 即 基于 日 志 的 文件 系统 技术 ) 的 重要 概念 进行 
阐述 。 最 后 ,我 们 在 第 13.8 节 对 全 章 内 容 进 行 归纳 总 结 。 


13.2 ”实例 研究 


一 般 来 说 ， 实 际 的 操作 系统 往往 会 综合 运用 第 12 章 所 描述 的 基本 技术 。 例 如 ， 我 们 
曾经 提 到 过 ， 某 些 操作 系统 既 支持 连续 文件 分 配 ( contiguous file allocation)， 又 支持 链 
接 文件 分 配 ( chained file allocation， 或 称 为 链 式 文件 分 配 )。 在 下 面 的 几 个 小 节 中 ， 我们 
将 对 文件 系统 展开 实例 研究 ， 即 近 距 离 地 审视 一 些 现代 的 文件 系统 ， 并 探讨 它们 的 实现 
机 理 。 


13.2.1 ”FAT 文件 系统 


我 们 仔细 研究 的 第 一 种 文件 系统 是 一 种 链接 系统 的 改版 。 需 要 强调 的 是 ， 这 种 文件 系统 
没有 在 每 个 数据 盘 块 中 包含 指向 下 一 个 数据 盘 块 的 指针 ， 而 是 把 那些 指针 都 统一 存放 在 一 个 
单独 的 表 中 。 这 种 文件 系统 曾经 用 在 原来 的 微软 DOS 操作 系统 中 ， 并 按 用 来 存放 相关 指针 
的 表 的 区 域 的 名 称 ， 即 文件 分 配 表 ( File Allocation Table，FAT) 进行 了 命名 。 在 FAT 文件 
系统 中 ， 文 件 分 配 表 并 没有 保存 在 用 于 存储 数据 的 区 域 中 。 进 一 步 说， 文件 分 配 表 位 于 磁盘 
上 刚好 在 引导 块 之 后 的 一 个 单独 的 区 域 中 。 该 表 中 将 会 顺序 给 出 数据 区 中 的 每 个 盘 块 所 对 应 
的 一 个 盘 块 指针 。 如 果 有 关 盘 块 尚未 分 配给 一 个 文件 ， 那 么 对 应 表 项 中 的 指针 将 设置 为 零 。 
而 如 果 某 个 盘 块 是 一 个 文件 的 一 部 分 ， 那么 对 应 表 项 通常 情况 下 应 包含 指向 同一 文件 中 的 下 
一 个 盘 块 的 指针 。 特 别 地 ， 如 果 有 关 盘 块 是 所 在 文件 中 的 最 后 一 个 盘 块 ， 那么 对 应 表 项 将 包 
含 一 个 特殊 的 指针 值 ， 用 来 指示 对 应 盘 块 已 是 文件 盘 块 列表 的 结尾 盘 块 。 图 13-1 显示 了 一 
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个 FAT 文件 系统 及 其 中 的 两 个 文件 。 图 中 ， 我 们 把 文件 结束 标志 标记 为 FFFFFFFF。 
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图 13-1 FAT 文件 系统 及 其 文件 示例 


关于 文件 分 配 表 机 制 ， 有 一 些 很 有 意思 的 事情 需要 注意 。 首 先 ， 其 没有 设立 单独 的 机 制 
来 跟踪 空闲 空间 。 空 闲 空间 的 相关 盘 块 在 文件 分 配 表 中 的 相应 表 项 均 为 0 ( 译 者 注 : 即 所 含 
盘 块 指针 取 值 为 0 )。 其 次 ， 利 用 文件 分 配 表 很 容易 为 一 个 文件 分 配 连 续 的 空间 。 就 像 采 用 
位 图 空闲 空间 机 制 一 样 ， 为 了 找到 一 组 连续 的 空闲 盘 块 而 必须 完成 的 全 部 事情 就 是 ， 扫 描 文 
件 分 配 表 并 查找 一 个 连续 的 零 指 针 串 。 同 时 ， 采 用 文件 分 配 表 方 式 也 很 容易 实现 单一 扇 区 的 
分 配 ， 能 够 支持 面向 链接 文件 访问 的 单个 盘 块 的 分 配 。 

最 初 的 FAT 文件 系统 设计 是 针对 软盘 驱动 器 而 创建 的 ， 故 而 有 关 的 指针 十 分 短小 ， 对 
应 系统 后 来 被 称 为 FAT12 文件 系统 。 这 种 文件 系统 曾经 被 用 在 早期 的 小 硬盘 上 。 然 而 ， 磁 
盘 容 量 迅速 扩 增 ， 到 后 来 ， 即 使 不 是 用 单个 扇 区 而 是 采用 较 大 的 盘 块 ( 译 者 注 : 盘 块 在 FAT 
系列 文件 系统 中 又 称 为 徐 ， 即 cluster， 由 若干 扇 区 组 成 ) 进行 分 配 ， 也 无 法 覆盖 到 整个 磁 
盘 空 间 。 为 此 ， 一 种 新 的 文件 系统 被 设计 出 来 ， 其 与 FAT12 文件 系统 非常 相似 ， 但 是 采用 
了 较 大 的 指针 ， 该 系统 被 称 为 FAT16 文件 系统 。 鉴 于 当时 的 计算 机 拥有 16 位 的 字 长 大 小 ， 
所 以 FAT16 文件 系统 所 设 定 的 指针 大 小 在 那个 时 代 看 来 是 开展 文件 系统 设计 的 一 个 相当 合 
理 的 尺寸 。 尽 管 如 此 ， 这 一 大 小 还 是 相当 受 限 的 ， 因 此 FAT16 文件 系统 设计 方案 后 来 被 
FAT32 文件 系统 所 取代 。 关 于 这 三 种 文件 系统 的 概括 总 结 如 表 13-1 所 示 。 
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表 13-1 各 种 FAT 文件 系统 的 比较 


FAT12 文件 系统 FAT16 文件 系统 










FAT32 文件 系统 
中 型 到 非常 大 的 硬盘 





之 260 000 000 






所 采用 的 盘 块 大 小 
最 大 卷 大 小 (以 字 节 为 单位 ) 


4KB 一 32KB 
大 约 2” 












16 736 256 2147 133 200 


13.2.2 NTFS 文件 系统 


NTFS 是 Windows NT 系列 操作 系统 自己 的 文件 系统 ， 并 且 是 基于 两 级 索引 结构 改进 而 
形成 的 。 进 一 步 说 ，NTFS 使 用 一 个 主 文件 表 ( Master File Table，MFT) 来 存放 关于 文件 和 
目录 的 所 有 元 数据 ( metadata) 。 在 主 文件 表 中 ， 系 统 为 每 个 文件 创建 了 一 条 文件 记录 ( file 
record)， 同 时 为 每 个 文件 夹 (folder， 即 目录 ,三 者 是 等 同 的 ) 创建 了 一 条 文件 夹 记 录 
( folder record)， 甚 至 为 主 文件 表 自 身 也 创建 了 一 条 相应 的 记录 。 这 些 记 录 均 为 1KB 大 小 8， 
且 分 别 包含 有 相应 文件 (或 文件 夹 ) 的 所 有 属性 。NTFS 文件 系统 把 一 个 文件 (或 一 个 目录 ) 
中 的 数据 视 为 相应 文件 的 属性 之 一 。 如 果 在 主 文件 表 对 应 记录 中 可 以 容纳 下 所 有 的 属性 ， 那 
么 将 不 再 为 相应 文件 分 配 单独 的 空间 。 这 意味 着 ,一 个 小 文件 或 小 目录 (大 约 900 字 节 ) 将 
会 完全 地 存放 在 主 文件 表 的 对 应 记录 中 。 图 13-2 给 出 了 主 文件 表 中 关于 一 个 小 文件 (或 一 
个 小 的 文件 夹 ) 的 记录 结构 。 如 果 主 文件 表 中 的 有 关 记 录 无 法 容纳 下 对 应 数据 属性 ， 那 么 将 
会 分 配 一 个 或 多 个 数据 盘 块 来 存放 相应 数据 ， 同 时 在 主 文件 表 中 的 对 应 记录 上 将 会 建立 一 个 
索引 指向 相应 数据 盘 块 。 通 常情 况 下 ， 每 个 文件 只 会 在 主 文件 表 中 拥有 一 条 文件 记录 。 然 
而 ， 如 果 一 个 文件 拥有 许多 属性 或 非常 零散 ， 那 么 对 应 文件 在 主 文件 表 中 可 能 需要 一 条 以 上 
的 记录 。 在 这 种 情况 下 ， 相 应 文件 在 主 文件 表 中 的 第 一 条 记录 被 称 为 文件 基本 记录 ， 存 放 有 
相应 文件 所 需 的 文件 扩展 记录 的 位 置 。 






文件 夹 (或 目录 ) 记录 包含 有 索引 信息 。 小 文件 夹 的 记录 完全 驻 留 在 主 文件 表 结 构 中 。 
而 大 的 目录 则 组 织 成 B 树 结构 ， 并 且 该 结构 带 有 一 系列 指针 指向 若干 外 部 的 徐 , 簇 中 包含 
有 不 能 包含 在 主 文件 表 结构 中 的 目录 项 。 当 NTFS 文件 系统 在 一 个 非常 大 的 文件 夹 中 保存 有 
若干 文件 的 时 候 ，B 树 结构 的 好 处 是 显而易见 的 。 进 一 步 说 ，B 树 结构 把 相似 的 文件 名 集中 
到 一 起 、 归 为 一 组 和 放 到 一 个 盘 块 中 ， 这 样 系统 仅仅 需要 搜索 包含 对 应 文件 的 分 组 即 可 ， 从 
而 将 会 使 文件 查找 所 需 的 磁盘 访问 工作 量 最 小 化 。 关 于 NTFS 文件 系统 的 其 他 要 点 包括 : 

。 使 用 一 个 位 图 来 记录 空闲 空间 。 

。 在 后 来 的 版 本 中 支持 可 变 的 盘 块 ( 簇 ) 大 小 。 

。 支持 整个 文件 系统 、 目 录 、 子 树 或 单个 文件 的 压缩 。 

。 支持 整个 文件 系统 、 目 录 、 子 树 或 单个 文件 的 加 密 。 


日 事实 上 ，NTEFS 系统 的 详细 资料 属于 专利 性 质 。 这 里 使 用 的 数字 得 到 大 家 的 普遍 认可 ， 但 不 一 定 非常 准确 。 
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e 支持 软件 RAID 1 和 软件 RAID 5 ( 见 第 14 章 第 14.6 节 )。 

e 保持 关于 系统 不 再 使 用 的 坏 复 的 一 个 单独 的 映射 。 

e 针对 仅仅 包含 二 进 制 零 ( 即 nulls) 的 一 个 文件 ， 不 会 写 到 磁盘 ( 较 大 的 ) 部 分 。 
e 一 种 事务 型 (基于 日 志 的 ) 文件 系统 ( 见 第 13.7 节 )。 


13.2.3 UNIX 和 Linux 的 文件 系统 


UNIX 及 其 衍生 的 许多 操作 系统 (如 Linux) 均 支持 多 种 不 同 的 文件 系统 ， 但 它们 对 ext 
文件 系统 的 支持 则 是 相当 普遍 的 。ext 文件 系统 采用 某 个 版 本 的 多 级 索引 方案 来 保存 文件 相 
关 的 元 数据 ， 而 相关 数据 存储 在 磁盘 上 称 为 索引 结 点 (inode) 的 一 张 表 中 。 在 UNIX 目录 
中 ， 每 个 表 项 只 包含 有 对 应 项 的 名 称 及 其 存放 位 置 的 数值 型 引用 。 该 引用 被 称 为 索引 结 点 编 
号 (i-number 或 inode number)， 是 对 所 谓 索 引 结 点 列表 (〈i-list， 或 称 为 索引 结 点 集 ) 的 索引 。 
索引 结 点 列表 的 位 置 和 格式 以 及 索引 结 点 的 内 容 等 具体 细节 在 一 定 程度 上 取决 于 特定 UNIX 
版 本 或 其 衍生 操作 系统 ， 同 时 ， 典 型 的 索引 结 点 信息 如 表 13-2 所 示 。 这 里 所 关注 的 是 在 索 
引 结 点 里 有 什么 信息 以 及 哪些 信息 没有 放 在 索引 结 点 里 。 首 先 ， 文 件 名 没有 放 进 索引 结 点 。 
UNIX 系统 允许 文件 拥有 别名 ， 这 意味 着 一 个 以 上 的 目录 项 可 以 指向 同一 个 文件 。 另 外， 对 
同一 文件 的 不 同 引用 并 不 要 求 使 用 相同 的 名 称 。 因 此 ， 文 件 名 存放 在 目录 中 ， 且 相应 的 目录 
项 指向 包含 有 对 应 文件 所 有 其 他 元 数据 的 索引 结 点 。 其 次 ， 索 引 结 点 中 有 一 项 给 出 了 指向 对 
应 文件 的 目录 项 的 数量 。 当 一 个 文件 的 某 个 目录 项 被 删除 时 ， 引 用 计数 将 会 递减 ( 即 做 减 一 
操作 )， 但 是 文件 本 身 直 到 引用 计数 变 为 零 时 才 会 被 删除 。 

UNIX 文件 系统 的 索引 结 点 结构 是 一 种 混合 的 索引 结构 变 体 。 其 中 ， 有 许多 指针 直接 
指向 数据 盘 块 ， 这 类 指针 的 数量 不 尽 相同 ， 但 通常 在 10 一 13 之 间 。 当 文件 被 打开 时 ， 对 
应 索引 结 点 会 加 载 进 主 存 ， 故 而 ， 如 果 相应 文件 非 
常 小 ,那么 指向 前 几 个 盘 块 的 指针 已 经 获得 和 可 以 
直接 使 用 。 但 是 ， 如 果 文 件 足 够 大 并 且 所 需 盘 块 数 文件 类 型 
比 直接 指针 所 指向 的 盘 块 的 数量 还 要 大 ， 那 么 下 一 -访问 权限 _ 读 、 写 ， 等 等 
个 指针 就 应 当 是 指向 一 个 单 级 索引 盘 块 的 指针 。 如 文件 被 引用 的 目录 项 的 计数 
果 系 统 采用 的 是 4KB 大 小 的 盘 块 ， 那 么 这 个 一 级 ”所 有 者 
索引 盘 块 里 最 多 可 以 包含 对 应 文件 直接 指针 所 指 盘 。 所 有 者 组 别 
块 之 外 的 1024 个 盘 块 。 而 如 果 所 有 这 些 空 间 也 被 ”创建 时 的 日 期 和 时 间 
用 完 ， 那么 还 需 用 索引 结 点 里 的 下 一 项 ， 即 指向 一 ”最 后 _ 次 访问 的 日 期 和 时 间 
个 两 级 索引 盘 块 的 指针 。 该 索引 盘 块 所 包含 的 指针 最 后 一 次 修改 的 日 期 和 时 间 
并 没有 指向 数据 盘 块 ， 而 是 指向 其 他 的 索引 盘 块 。 下 不 
因此 该 索引 盘 块 将 会 寻 址 1024 个 索引 盘 块 ， 从 而 一 攻 拓 让 次 失 科 
总 共 寻 址 会 100 万 个 数据 盘 块 。 而 如 果 这 也 不 足以 er 
容纳 下 有 关 文 件 的 数据 ， 则 索引 结 点 中 的 下 一 项 即 
指向 一 个 三 级 索引 盘 块 的 指针 就 必须 得 用 上 了 。 还 
是 按照 刚才 所 描述 的 4KB 大 小 的 盘 块 来 进行 推算 ， 
那么 该 三 级 索引 结 钧 就 可 以 寻 址 超过 4TB 的 文件 _ 单 级 索引 盘 块 指针 
空间 。 两 级 索引 盘 块 指针 


当 一 个 UNIX 文件 系统 被 初始 化 时 ， 将 会 建立 _ 三 级 案 引 盘 决 指针 


表 13-2 ”典型 的 UNIX 索引 结 点 内 容 


数据 盘 块 指针 10 (有 时 为 数据 盘 块 指针 13 ) 
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一 个 与 对 应 磁盘 分 区 大 小 及 所 采用 盘 块 大 小 相 适 应 的 恰当 大 小 的 索引 结 点 列表 。 于 是 ， 一 系 
列 空 的 索引 结 点 将 被 创建 并 均匀 分 布 在 整个 分 区 上 。 当 为 一 个 文件 分 配 盘 块 的 时 候 ， 首 先 会 
从 靠近 对 应 索引 结 点 的 可 用 盘 块 中 进行 选择 。 这 种 处 理 方式 将 有 助 于 使 分 配给 一 个 文件 的 所 
有 盘 块 尽量 是 彼此 相 邻 的 。 只 要 其 他 进程 没有 访问 太 多 的 位 于 驱动 器 其 他 地 方 的 其 他 文件 ， 
那么 这 还 将 有 利于 使 访问 对 应 文件 所 需 的 查寻 时 间 最 小 化 。 


13.3 挂 载 


有 些 时 候 ， 我 们 必须 得 和 具有 多 重 涵义 的 计算 机 科学 方面 的 术语 ( 称 之 为 重 载 ) 打交道 。 
挂 载 (mounting) 就 是 这 样 的 一 个 术语 。 实 际 上 ， 这 个 术语 的 两 种 含义 是 相关 的 ， 但 乍 看 起 
来 ， 它 们 却 似乎 指 的 是 不 同类 型 的 操作 。 其 第 一 种 含义 指 的 是 当 包含 有 文件 系统 的 一 个 磁盘 
驱动 器 分 区 即将 被 操作 系统 访问 的 时 候 所 必须 完成 的 相关 事项 。 而 其 第 二 种 含义 则 是 指 用 来 
赋予 用 户 指定 位 于 一 个 远程 目录 上 的 文件 的 手段 的 过 程 。 


13.3.1 本 地 文件 系统 挂 载 


在 操作 系统 允许 用 户 访问 特定 的 文件 系统 之 前 ， 系 统 必须 要 完成 某 些 事 情 。 例 如 ， 读 取 
用 来 描述 分 区 的 元 数据 ， 把 空闲 空间 机 制 的 某 些 部 分 (譬如 预先 分 配 的 某 些 盘 块 等 ) 读 到 内 
存 ， 读 取代 表 目 录 树 根部 的 目录 ( 即 所 谓 的 根 目录 )， 等 等 。 这 一 过 程 被 称 为 挂 载 。 当 安装 
操作 系统 时 ， 往 往 会 说 明 相 应 系统 要 访问 的 一 些 分 区 ， 而 通常 情况 下 这 些 分 区 将 会 在 操作 系 
统 每 次 启动 时 被 挂 载 ， 并 且 这 些 分 区 往往 是 本 地 的 硬盘 驱动 器 上 的 分 区 。 然 而 ， 对 于 可 移动 
介质 而 言 ， 操 作 系统 之 间 还 是 存在 区 别 的 。 进 一 步 说 ， 操 作 系 统一 般 按 如 下 三 种 方式 之 一 来 
处 理 可 移动 介质 : 1 ) 当 有 关 介质 插 人 驱动 器 时 ， 采 用 隐 式 挂 载 ; 2 ) 当 有 关 介 质 被 首次 访问 
时 ， 采 用 隐 式 挂 载 ， 3 ) 必须 通过 明确 的 挂 载 命 令 来 启动 挂 载 。 

UNIX 及 其 大 多 数 变种 传统 上 均 会 使 用 最 后 的 一 种 机 制 。 也 就 是 说 ， 在 用 户 给 出 特定 的 
挂 载 命 令 之 前 ， 可 移动 介质 是 不 能 被 访问 的 。 由 于 微软 DOS 操作 系统 格式 化 的 软盘 是 如 此 
普遍 其 至 可 以 说 是 无 处 不 在 ， 所 以 这 实际 上 便 产生 了 一 种 有 益 的 副作用 。 进 一 步 说 ， 这 推动 
了 支持 用 户 明 确 指定 一 张 软盘 究竟 要 包含 哪 一 种 文件 系统 格式 : UNIX、MS-DOS 还 是 Mac。 
后 来 版 本 的 Linux 和 UNIX 已 经 开始 尝试 在 有 关 介 质 插 人 时 进行 隐 式 挂 载 ， 且 其 就 此 所 采用 
的 术语 为 自动 挂 载 (automounting )。 微 软 DOS 操作 系统 和 Windows 系列 操作 系统 则 一 直 采 
用 当 尝 试 第 一 次 访问 介质 时 的 隐 式 挂 载 。 在 过 去 ，Mac 操作 系统 通常 是 每 当 可 移动 介质 插入 
驱动 器 时 就 触发 相应 的 自动 挂 载 。 不 过 ， 鉴 于 Mac 系列 操作 系统 是 基于 UNIX 操作 系统 的 ， 
所 以 其 现在 也 采用 了 与 UNIX 相同 的 挂 载 方式 。 

在 光盘 (Compact Disc，CD) 领域 的 情况 则 有 所 不 同 。 在 相当 早期 光盘 开发 时 ， 大 量 的 
供应 商 聚 集 到 一 起 召开 会 议 ， 针 对 数据 和 音频 光盘 达成 一 致意 见 ， 并 决定 采用 通用 的 格式 。 
这 种 格式 最 终 被 指定 为 国际 标准 ISO-9660。 这 种 通用 的 格式 意味 着 没有 理由 像 UNIX 系统 
那样 来 推迟 挂 载 了 ， 因 此 光盘 往往 是 在 插入 时 立即 挂 载 的。 这 便 允 许 有 关 操 作 系 统 检测 光盘 
的 格式 ( 即 音 频 格式 、 数 据 格 式 或 混合 格式 )， 并 且 当 此 类 光盘 插入 时 还 可 按 默 认 选 项 来 予 
以 启动 执行 。 这 意味 着 ， 如 果 用 户 做 出 了 相应 的 选择 ,插入 一 张 音频 光盘 将 会 按照 用 户 的 选 
择 启动 一 个 光盘 音频 播放 器 应 用 程序 来 播放 这 张 光 盘 。 同 样 ， 一 张 数据 光盘 可 以 包含 一 组 在 
常见 操作 系统 上 针对 光盘 进行 处 理 的 相关 指令 。 许 多 数据 光盘 经 常会 自动 运行 一 个 依赖 于 操 
作 系 统 的 脚本 文件 来 启动 光盘 上 的 软件 。 
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13.3.2 ”远程 文件 系统 挂 载 


当 请 求 操 作 系统 来 访问 位 于 一 台 远 程 计 算 机 上 的 文件 系统 时 ， 也 会 发 生 类 似 的 过 程 ， 不 
过 相关 细节 却 杀 然 不 同 。 远 程 文件 系统 有 可 能 是 整个 文件 系统 都 被 提供 给 用 户 使 用 ， 但 更 为 
可 能 的 是 一 个 文件 系统 的 某 些 部 分 而 不 是 整个 文件 系统 的 所 有 部 分 。 其 间 必 须要 克服 的 一 大 
困难 在 于 ,远程 文件 系统 运行 的 平台 可 能 与 本 地 文件 系统 完全 不 同 。 具 体 来 说 ， 数 据 表 示 可 
能 不 同 ， 文 件 命名 规则 可 能 不 同 ， 目 录 结 构 也 可 能 不 同 ， 等 等 。 为 了 克服 和 消除 这 些 差异 ， 
我 们 必须 围绕 如 何 表 示 相 关 信 息 以 及 如 何 运 用 有 关 协 议 来 交换 信息 等 建立 完善 的 规则 。 在 大 
多 数 情况 下 ， 相 关 规 则 和 协议 往往 是 由 一 个 平台 的 供应 商 所 建立 的 允许 对 他 们 的 系统 进行 互 
操作 的 事实 上 的 规则 。 其 他 厂商 将 会 创建 软件 包 通 过 其 他 平台 来 访问 这 些 系 统 。 有 时 ， 这 些 
规则 还 会 成 为 开放 的 标准 ， 就 像 网 络 文件 系统 (Network File System，NFS; 参见 第 13.4.2 节 ) 
一 样 。 然 而 有 些 时 候 ， 相 关 规 则 却 是 由 其 他 厂商 通过 逆向 工程 而 形成 的 。 无 论 哪 一 种 情况 ， 
都 是 远程 系统 在 实施 目录 访问 操作 ， 但 是 相关 信息 必须 要 映射 到 客户 端的 操作 系统 环境 中 。 
例如 ， 如 果 客 户 端 是 Windows 系统 ， 那 么 远程 文件 系统 的 象征 就 是 相应 的 那个 “驱动 器 盘 
符 ”。 起 初 ， 这 些 盘 符 曾 经 在 DOS 系统 中 用 来 指示 一 个 系统 上 的 实际 驱动 器 。 而 远程 文件 
系统 则 采用 了 相同 的 约定 ， 并 且 将 会 被 指定 一 个 当前 没有 用 于 本 地 资源 的 驱动 器 盘 符 。 相 比 
之 下 ，UNIX 系统 把 所 有 的 文件 系统 一 一 包括 像 proc 和 dev 之 类 的 伪 目 录 一 一 都 看 作 是 一 个 
树 形 结构 。 因 此 ， 对 于 UNIX 之 类 的 系统 来 说 ， 对 一 个 远程 文件 系统 的 映射 仅仅 需要 在 文件 
系统 树 形 结构 中 添加 (或 更 换 ) 一 个 目录 结 点 ， 且 有 关 结 点 把 自身 标识 成 指向 相应 的 远程 
资源 。 

从 程序 设计 人 员 的 角度 来 看 ， 文 件 系 统 的 远程 挂 载 则 是 一 种 强大 的 工具 。 一 般 来 说 ， 有 
关 程 序 并 不 知道 本 地 文件 (local file) 和 远程 文件 (remote file) 之 间 有 什么 区 别 。 换 句 话 
说 ， 有 关 程 序 完全 不 需要 进行 任何 修改 ， 就 能 够 跨越 网 络 进行 操作 。 遗 憾 的 是 ， 这 并 不 总 是 
一 种 明智 之 举 。 考 虑 一 下 数据 库 软 件 程序 的 案例 ， 假 定 该 程序 正在 访问 一 个 通过 网 络 远程 挂 
载 的 数据 库 文 件 。 当 检索 数据 的 索引 时 ， 数 据 库 程序 将 会 陷 大 跨 网 络 的 大 量 数据 的 读 取 和 
写 人 操作 的 “泥潭 ”之 中 。 这 如 果 是 在 流量 负荷 较 低 的 快速 的 局 域 网 ( Local Area Network， 
LAN) 当中 ， 相 关 性 能 还 可 能 是 可 以 接受 的 ， 但 如 果 是 广域网 (Wide Area Network，WAN) 
连接 或 者 网 络 流量 相当 可 观 ， 那 么 文件 系统 的 远程 挂 载 可 能 并 不 是 一 种 很 好 的 方案 。 在 这 
种 情况 下 ， 更 好 的 选择 应 当 是 在 远程 计算 机 上 运行 数据 库 程序 ， 同 时 通过 网 络 来 发 送 SQL 
( Structured Query Language， 结 构 化 查询 语言 ) 命令 ， 并 且 仅 仅 取 回 最 终 的 结果 。 如 果 能 够 
使 用 先前 存放 在 远程 服务 器 上 的 相关 命令 ， 甚 至 会 更 胜 一 筹 。 当 然 ， 不 可 能 总 是 能 够 预测 
出 所 有 的 查询 从 而 使 它们 事先 存放 在 服务 器 上 。 有 些 时 候 ， 即 席 查询 (ad hoc query) 是 必 
要 的 。 

让 文件 系统 中 的 一 个 结 点 成 为 对 远程 文件 系统 的 一 个 引用 可 能 会 引发 一 个 小 小 的 问题 。 
进一步 说 ， 路 径 名 现在 变 得 更 加 难以 解析 。 如 果 在 文件 系统 树 中 没有 这 些 远 程 引用 结 点 ， 解 
析 一 个 路 径 名 还 是 相当 简单 的 。 对 于 一 个 给 定 的 路 径 如 “ /fred/work/expenses”， 当 操作 系统 
解析 该 字符 串 时 ， 每 个 “/” 均 表示 进入 本 地 文件 系统 中 的 男 一 个 目录 。 但 是 ， 如 果 有 关 结 
点 可 能 代表 树 中 的 远程 文件 系统 ,那么 相应 文件 系统 必须 逐 级 检查 ， 以 确认 对 应 的 结 点 是 本 
地 目录 还 是 远程 文件 系统 ， 进 而 执行 相应 的 查找 过 程 。 

远程 挂 载 的 另 一 个 问题 是 ， 两 个 不 同 的 客户 端 可 能 在 各 自 的 本 地 文件 系统 中 的 不 同位 置 
挂 载 了 同一 个 给 定 的 远程 目录 。 对 于 Windows 系统 来 说 ， 两 个 用 户 可 能 为 相同 的 远程 文件 
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系统 指派 了 一 个 不 同 的 驱动 器 盘 符 。 而 对 于 UNIX 之 类 的 操作 系统 来 说 ,两 个 用 户 则 可 能 把 
同一 个 远程 文件 系统 挂 载 到 了 各 自 的 本 地 文件 系统 的 一 个 不 同 逻辑 结 点 上 。 之 后 . 如 果 某 用 
户 的 机 器 上 的 一 个 进程 向 另 一 个 用 户 的 机 器 上 的 一 个 进程 发 送 了 一 个 路 径 名 ,那么 第 二 人 台 机 
器 有 可 能 无 法 找到 对 应 的 文件 ， 因 为 它们 的 路 径 是 不 同 的 。 有 关 管 理 人 员 可 以 通过 定义 标准 
化 的 挂 载 脚本 ， 以 在 用 户 登 录 时 加 以 运行 并 为 公共 访问 资源 的 所 有 用 户 提供 更 加 一 致 的 路 径 
命名 机 制 ， 缓 解 乃 至 消除 这 一 问题 。 


13.4 多 文件 系统 和 重 定向 


至 于 许多 其 他 的 情况 ， 操 作 系 统 将 会 向 应 用 程序 接口 呈现 文件 的 抽象 描述 。 有 关 程 序 不 
应 该 知道 文件 系统 是 什么 样 的 。 对 于 一 个 应 用 程序 而 言 ， 如 果 其 使 用 了 错误 的 文件 系统 ， 很 
可 能 会 发 生性 能 方面 的 差异 ,但 有 关 应 用 程序 的 编码 不 应 该 受到 影响 。 这 确实 是 一 个 系统 工 
程 的 问题 。 如 果 有 关 应 用 程序 被 设计 为 随机 访问 一 个 文件 ， 并 且 相 应 的 文件 系统 支持 随机 访 
间 ， 那 么 该 应 用 程序 应 该 不 会 意识 到 任何 其 他 差异 。 在 大 多 数 系统 中 ， 往 往 要 求 操 作 系统 支 
持 多 种 不 同 的 文件 系统 。 最 起 码 来 说 ， 如 果 不 是 由 于 其 他 的 原因 ， 其 必要 性 就 在 于 ， 对 于 不 
同 的 介质 常常 适合 采用 不 同 的 文件 系统 。 对 于 光盘 来 说 ， 通 常情 况 下 只 有 ISO-9660 标准 格 
式 需 要 考虑 ， 尽 管 有 一 些 非 常 早期 的 光盘 曾经 是 以 专 有 的 格式 创建 的 。 对 于 软盘 而 言 ， 几 乎 
是 默认 的 ， 也 就 是 说 ， 有 关 操 作 系 统 必须 能 够 读 取 和 写 操 作 那 些 源 自 于 微软 DOS 操作 系统 
的 FAT12 格式 的 软盘 。 不 过 ，Mac 格式 和 UNIX 格式 同样 也 被 广泛 使 用 。 即 使 是 硬盘 驱动 
器 ， 有 时 也 会 期 望 支持 有 关 操 作 系 统 的 原生 格式 之 外 的 另 一 种 格式 。 在 一 个 系统 升级 到 一 种 
新 的 操作 系统 或 者 新 版 的 相同 操作 系统 时 ， 这 一 需求 通常 就 会 发 生 。 即 便 有 关 操 作 系 统 是 相 
同 的 ,但 新 版 的 操作 系统 也 有 可 能 随身 携带 了 一 种 新 的 更 棒 的 文件 系统 。 尽 管 如 此 ， 当 第 一 
次 执行 升级 过 程 时 ， 有 关 文件 系统 仍然 会 维持 那 种 旧 的 格式 。 之 后 ， 经 常 需要 单独 的 步骤 把 
旧 的 文件 系统 格式 转换 为 新 的 格式 。 一 个 系统 常常 还 需要 包含 两 种 不 同 的 操作 系统 ， 并 且 根 
据 当 前 的 需要 启动 进入 不 同 的 操作 系统 。 现 在 ， 甚 至 经 常会 看 到 一 个 虚拟 机 操作 系统 上 同时 
运行 着 两 个 不 同 的 客户 机 操作 系统 ， 并 在 不 同 的 驱动 右上 支持 不 同 的 文件 系统 。 男 外 还 有 人 
期 望 ， 不 管 当前 使 用 的 是 什么 操作 系统 ， 都 应 当 能 够 访问 有 关 磁 盘 驱动 器 上 的 所 有 各 式 各 样 
的 文件 系统 。 基 于 所 有 这 些 原因 的 考量 ， 故 而 操作 系统 需要 支持 许多 不 同 的 文件 系统 格式 。 


13.4.1 虚拟 文件 系统 


正 是 为 了 透明 地 在 同一 个 系统 上 同时 支持 多 个 文件 系统 ，UNIX 系统 开发 人 员 创 建 了 一 
种 机 制 。 这 种 机 制 被 称 为 虚拟 文件 系统 ( Virtual File System，VFS)。 虚 拟 文件 系统 是 添加 
到 UNIX 系统 且 位 于 文件 系统 模块 之 上 的 单独 的 一 层 。 实 际 上 ， 虚 拟 文件 系统 是 和 支持 不 
同文 件 系 统 的 多 个 文件 系统 模块 一 起 加 载 到 系统 中 的 。 虚 拟 文件 系统 支持 与 现 有 文件 系统 相 
同 的 应 用 程序 接口 ， 故 而 有 关 应 用 程序 无 须 进行 修改 。 图 13-3 给 出 了 虚拟 文件 系统 引入 前 
和 引入 后 的 应 用 程序 与 文件 系统 间接 口 的 变化 示意 图 ， 分 别 对 应 图 13-3a 和 图 13-3b。 当 有 
请 求 传 到 虚拟 文件 系统 层 的 时 候 ， 虚 拟 文件 系统 将 会 检查 有 关 请 求 ， 通 过 查看 文件 系统 树 的 
相关 结 点 ， 进 而 确定 哪 一 个 文件 系统 模块 是 对 应 于 该 请 求 的 相应 文件 系统 的 正确 的 模块 。 然 
后 ， 虚 拟 文件 系统 将 会 把 该 请 求 传递 到 相应 的 文件 系统 模块 。 当 对 应 文件 系统 模块 完成 该 请 
求 任务 时 ， 其 将 会 把 控制 权 返 还 给 虚拟 文件 系统 模块 ， 而 后 者 再 进一步 把 控制 权 返 还 给 当初 
发 出 该 请 求 的 主 调 应 用 程序 。 
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中) 虚拟 文件 系统 引入 之 前 日 虚拟 文件 系统 引入 之 后 
图 13-3 ”虚拟 文件 系统 屋 的 引信 


13.4.2 网络 文件 系统 


虚拟 文件 系统 也 被 用 于 把 有 关 的 文件 系统 请 求 重 定向 到 采用 由 Sun 微 系统 公司 开发 的 网 
络 文件 系统 (Network File System，NFS) 协议 而 远程 挂 载 的 相关 驱动 器 上 。 这 一 过 程 曾经 
在 前 面 的 远程 挂 载 的 主题 部 分 有 所 提 及 。 图 13-4 显示 了 有 关机 制 的 工作 原理 。 在 图 的 上 方 
给 出 的 是 相应 的 客户 端 系统 。 其 间 ， 应 用 程序 通过 标准 的 关于 文件 操作 的 应 用 程序 接口 而 生 
成 了 相应 的 文件 请 求 。 接 下 来 ， 虚 拟 文件 系统 意识 到 该 请 求 要 基于 网 络 文件 系统 协议 来 访问 
另 一 个 系统 所 提供 的 一 个 文件 。 在 图 的 下 方 给 出 的 网 络 文件 系统 服务 器 就 是 这 里 所 说 的 另 一 
个 系统 。 于 是 ， 客 户 端 系统 的 虚拟 文件 系统 层 便 把 该 请 求 发 给 了 网 络 文件 系统 客户 端 ， 而 后 
者 则 利用 远程 过 程 调用 机 制 来 解决 异 构 操 作 系 统 环 境 的 相关 问题 ,具体 细节 将 会 在 第 17 章 
展开 进一步 的 讨论 。 简 单 来 说 ， 就 是 客户 端 通过 网 络 把 该 请 求 发 送 到 网 络 文 件 系统 服务 器 上 
运行 的 相应 守护 进程 。 然 后 ， 网 络 文件 系统 服务 器 守护 进程 拿 到 该 请 求 后 ， 将 之 发 给 服务 器 
系统 的 虚拟 文件 系统 层 ， 进 而 根据 有 关 请 求 (就 像 客户 端 是 本 地 的 一 样 ) 对 相应 文件 进行 了 
访问 ， 相 关 结 果 数 据 最 后 被 发 回 给 客户 端 系统 上 运行 的 主 调 应 用 程序 。 

















网 络 文件 系统 服务 器 
图 13-4 经 由 虚拟 文件 系统 的 网 络 文件 系统 服务 过 程 
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有 关 应 用 程序 发 出 的 请 求 由 网 络 文件 系统 客户 端 软 件 重 定向 到 正在 运行 网 络 文件 系统 服 
务 器 的 系统 上 ， 为 此 我 们 说 ， 当 前 使 用 的 模型 是 一 个 重 定向 器 (redirector)。 这 是 一 种 常见 
的 技术 ， 也 经 常 被 用 在 其 他 的 操作 系统 上 。 对 于 客户 端 应 用 程序 来 说 ， 网 络 文件 系统 几乎 是 
完全 透明 的 。 但 是 ， 在 有 关 文 件 可 以 被 客户 端 应 用 程序 访问 之 前 ， 网 络 文件 系统 服务 器 上 的 
相关 目录 必须 已 经 被 挂 载 上 ， 以 便 该 应 用 程序 能 够 找到 对 应 的 文件 。 这 一 步骤 是 不 透明 的 ， 
因为 有 关 用 户 (或 应 用 程序 ) 必须 要 指定 相应 的 服务 器 。 在 UNIX 衍生 的 操作 系统 里 ， 这 是 
通过 一 条 挂 载 命令 来 完成 的 。 该 挂 载 命令 将 会 指定 远程 系统 的 名 称 以 及 相应 系统 上 的 一 个 目 
录 ， 还 有 一 个 本 地 目录 。 随 后 ， 远 程 目 录 将 会 呈现 为 本 地 文件 系统 中 的 目录 树 的 一 部 分 ， 并 
且 其 对 于 任何 应 用 程序 的 所 有 操作 都 将 是 透明 的 ， 尽 管 这 些 文件 实际 上 是 远程 的 。 


13.5 内存 映射 文件 


在 许多 操作 系统 里 ， 还 会 发 现 另 一 种 文件 访问 机 制 ， 即 先前 在 第 11 章 的 高 级 内 存 技术 
部 分 曾经 讨论 过 的 内 存 映射 文件 。 这 一 机 制 与 文件 的 标准 概念 之 间 存 在 着 非常 大 的 区 别 。 也 
正 是 因为 它 是 如 此 的 不 同 ， 所 以 它 具 有 一 些 使 其 在 某 些 特定 情况 下 非常 有 用 的 特征 。 当 一 个 
应 用 程序 使 用 一 个 内 存 映射 文件 时 ， 其 应 告知 操作 系统 要 映射 的 文件 的 名 称 ， 然 后 操作 系统 
就 会 创建 一 个 按 字 节 方式 的 从 该 文件 的 寻 址 空间 到 相应 进程 的 逻辑 寻 址 空间 的 映射 。 为 此 ， 
关于 内 存 映 射 文件 的 第 一 项 非常 有 趣 的 特征 是 ， 相 关 文 件 系 统 的 所 有 机 制 并 没有 被 用 来 寻 址 
对 应 空间 。 相 反 ， 有 关 应 用 程序 把 内 存 映 射 文件 当 作 是 一 个 大 型 数组 来 进行 处 理 ， 并 使 用 下 
标 或 指针 运算 来 寻 址 整个 文件 。 期 间 ， 虚 拟 内 存 管理 器 监测 记录 在 物理 内 存 中 需要 对 应 文件 
空间 的 哪些 部 分 ， 跟踪 发 生 更 改 的 页 面 ， 并 根据 需要 将 这 些 页 面 写 到 磁盘 上 。 这 些 机 制 利用 
了 硬件 支持 ， 故 而 相 比 文件 系统 的 有 关机 制 要 更 为 高 效 。 或 许 你 还 记得 ， 因 为 与 分 页 机 制 之 
间 的 潜在 的 交互 处 理 ， 正 常 的 文件 处 理 要 么 把 进入 内 存 的 页 面 加 以 锁定 故而 抑制 相应 分 页 系 
统 的 性 能 ， 要 么 在 执行 输入 /输出 操作 之 前 把 输入 /输出 缓冲 区 复制 到 内 核 空间 。 然 而 ,把 有 
关 文件 映射 到 分 页 机 制 上 就 避免 了 这 些 问 题 ， 相 关 应 用 程序 也 无 须 再 去 执行 任何 内 存 分 配 。 

内 存 映 射 文件 的 第 二 项 很 有 趣 的 特征 是 允许 多 个 进程 同时 通过 内 存 映射 到 同一 文件 上 。 
(有 趣 的 是 ， 由 于 虚拟 内 存 硬 件 ， 这 些 进 程 并 没有 把 有 关 文 件 映 射 到 相同 的 逻辑 内 存 地 址 
上 。) 这 便 建 立 了 进程 间 通信 的 一 种 非常 高 效 的 方法 。 实 际 上 ， 有 关 “ 文 件 ” 并 不 一 定 真 的 
存在 。 相 关 进 程 可 以 纯粹 为 了 进程 间 通 信 的 目的 ， 而 说 出 一 个 临时 文件 的 名 称 。 尽 管 如 此 ， 
内 存 映射 机 制 内 部 并 没有 提供 任何 同步 机 制 。 如 果 由 多 个 进程 执行 的 操作 可 能 存在 冲突 ， 那 
么 必须 得 使 用 一 些 外 部 的 同步 机 制 来 保护 相关 进程 的 临界 区 。 内 存 映射 文件 机 制 的 另 一 个 
局 限 性 在 于 ， 有 关 映 射 文件 不 能 够 很 容易 地 扩 增 大 小 。 尽 管 有 些 时 候 映 射 文件 扩 增 也 是 可 能 
的 ,但 是 要 求 必须 对 相应 区 域 进 行 小 心 谨慎 的 重新 映射 。 内 存 映射 文件 机 制 的 第 三 个 局 限 性 
在 于 ， 其 没有 提供 异步 输入 /输出 机 制 。 对 于 应 用 程序 来 说 ， 鉴 于 有 关 分 页 硬件 是 透明 地 进 
行 读 写 操作 的 ， 而 输入 /输出 发 生 阻 塞 是 常 有 的 事情 ， 所 以 当 发 生 一 个 页 面 故 障 时 ， 有 关 进 
程 将 被 阻塞 但 却 无 法 知道 是 何 种 原因 。 最 后 一 个 需要 注意 的 方面 是 ， 如 果 有 关 文件 比 可 用 的 
人 逻辑 寻 址 空间 还 要 大 ， 那么 相关 映射 必须 得 非常 小 心 ， 并 确保 定位 在 文件 地 址 空间 。 


13.6 文件 系统 实用 例 程 


所 有 操作 系统 都 会 伴 有 一 些 实用 程序 (utility program， 或 称 为 实用 例 程 )， 而且 其 中 总 
会 包括 一 组 和 文件 系统 打交道 的 程序 。 有 些 实 用 程序 被 设计 成 是 在 操作 系统 运行 的 同时 来 


使 用 的 ， 它 们 包括 诸如 新 建 目 录 和 删除 文件 之 类 的 日 常 的 事情 。 这 些 程序 经 常 是 通过 命令 
行 界 面 (command-line interface， 又 称 为 命令 行 接口 ) 来 运行 的 。 表 13-3 就 列 出 了 DOS/ 
Windows 以 及 UNIX 之 类 的 系统 中 的 一 些 常 见 的 文件 系统 实用 程序 。 大 多 数 操作 系统 的 后 
来 的 版 本 主要 使 用 图 形 化 用 户 界 面 ， 而 相关 命令 往往 没有 一 个 名 字 是 大 多 数 用 户 都 知道 的 。 
请 注意 ， 其 中 有 些 命令 并 没有 出 现在 所 有 版 本 的 DOS/Windows 操作 系统 或 者 所 有 版 本 的 
UNIX/Linux 操作 系统 中 。 


表 13-3 一 些 文件 操作 命令 


实用 例 程 的 目的 和 作用 UNIX/Linux 
改变 文件 操作 权限 chmod 
列 出 目录 中 的 文件 ks 
删除 文件 系统 子 树 rm -Ri rmdir 
格式 化 磁盘 fdformat/mkfs 
改变 工作 目录 ER cd: chdir 
按 逐 页 方式 查看 文件 的 M 容 | more | ot 
创建 或 编辑 磁盘 分 区 cfdisk, parted, etc. 
创建 一 个 新 的 目录 mkdir 


这 些 实用 程序 主要 是 由 用 户 决定 要 做 的 事情 。 还 有 一 些 其 他 的 实用 例 程 也 是 必要 的 , 但 
它们 所 做 的 事情 尽管 可 能 对 用 户 也 很 重要 ,但 却 不 是 以 满足 用 户 的 任何 实际 需要 出 发 而 执 
行 的 。 进 一 步 说 ， 它 们 针对 文件 系统 进行 操作 以 确认 其 完整 性 或 提高 其 性 能 。 在 DOS 和 
Windows 操作 系统 环境 中 就 有 两 个 这 样 的 验证 工具 例 程 ( 即 磁盘 检查 修复 工具 例 程 ) 分 别称 
为 scandisk 和 checkdisk。 类 UNIX 系统 中 也 有 一 个 类 似 的 实用 例 程 ， 称 为 fsck。 除 了 用 来 
验证 文件 系统 的 一 致 性 和 完整 性 之 外 ， 这 些 实用 程序 还 可 以 选择 尝试 修复 它们 所 发 现 的 故 
障 。Windows 操作 系统 另外 还 有 一 个 被 称 为 defrag 的 磁盘 碎片 整理 例 程 ， 能 够 对 文件 系统 
中 的 有 关 文 件 重 新 组 织 以 提高 系统 的 性 能 ， 其 所 针对 的 相关 问题 在 前 面 关 于 链接 文件 分 配 的 
小 节 曾 经 讨论 过 。 类 UNIX 系统 的 支持 者 往往 声称 ， 他 们 的 文件 系统 从 设计 方案 上 就 排除 了 
碎片 整理 实用 例 程 的 需要 。 而 此 类 实用 程序 未 被 推 向 市 场 的 事实 则 表明 ， 这 种 说 法 至 少 是 相 
当 精 确 的 。 

某 些 看 起 来 很 像 实用 例 程 的 东西 实际 上 是 操作 系统 命令 接口 中 的 内 置 命令 (built-in 
command， 或 称 为 内 部 命令 )。 例 如 ， 在 DOS 或 Windows 操作 系统 中 ， 并 没有 可 执行 文件 
对 应 于 dir、del、time、type 等 命令 的 执行 。 这 些 功 能 非常 紧密 地 映射 到 了 操作 系统 应 用 程 
序 接口 中 的 监管 程序 调用 ( Super Visor Call，SVC， 又 称 为 访 管 ) 上 ， 故 而 命令 解释 器 (对 
于 DOS 操作 系统 而 言 就 是 command.com) 拥有 相应 内 置 的 功能 函数 ， 从 而 不 再 需要 外 部 模 
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块 。 这 便 节省 了 磁盘 空间 以 及 把 一 个 外 部 程序 加 载 到 内 存 的 时 间 。 


13.7 日 志 式 文件 系统 


尽管 系统 故障 极其 罕见 ， 但 它们 确实 会 发 生 。 这 也 正 是 为 什么 要 创建 文件 系统 验证 工 
具 。 当 操作 系统 正常 关机 时 ， 它 会 在 文件 系统 里 记录 一 条 关于 正常 关机 的 说 明 。 当 操作 系统 
启动 时 ， 它 会 检查 确认 上 次 系统 是 否 正 常 关 机 或 是 否 月 演 。 传 统 上 ， 如 果 有 关系 统 崩 演 了 ， 
那么 在 挂 载 文 件 系 统 之 前 ， 操 作 系 统 将 会 运行 文件 系统 完整 性 检查 程序 。 如 果 一 个 有 崩 演 的 系 
统 是 在 被 唯一 的 一 个 用 户 所 使 用 ， 那 么 在 故障 发 生 时 真正 发 生 任何 实际 后 果 的 可 能 性 往往 会 
比较 低 。 即 使 是 对 于 非常 忙碌 的 服务 器 也 常常 不 会 产生 什么 高 风险 的 损失 。 当 然 ， 与 单 用 户 
系统 上 的 崩 演 相 比 ， 任 何 服务 器 故障 所 可 能 导致 的 问题 将 会 影响 到 更 多 的 用 户 。 还 有 ， 对 于 
单个 用 户 而 言 ， 其 在 任何 情况 下 都 不 会 愿意 失去 任何 东西 。 不 管 怎样 ， 操 作 系统 开发 人 员 努 
力 探 索 相 关 方 法 以 确保 文件 系统 能 够 更 加 健壮 地 应 对 故障 。 

当 一 个 盘 块 已 经 被 添加 到 一 个 文件 并 且 该 文件 被 关闭 的 时 候 ， 那 么 某 些 事项 可 能 必须 
得 付 诸 实施 。 璧 如， 我 们 一 定 得 把 包含 有 关 数 据 盘 块 的 记录 写 到 磁盘 上 ， 我 们 还 可 能 得 查找 
下 一 个 空闲 盘 块 、 更 新 空闲 空间 信息 以 标示 相应 盘 块 已 被 使 用 ， 以 及 更 新 对 应 文件 的 有 关 目 
录 项 以 标示 该 文件 最 后 一 次 写 人 的 时 间 ， 等 等 。 一 般 来 说 ,我 们 希望 所 有 这 些 信息 的 更 新 
是 以 原子 方式 来 实现 的 一 一 或 者 所 有 信息 都 写 到 了 硬盘 上 ,或 者 其 中 的 任何 更 新 均 未 付 诸 
实施 。 在 应 用 程序 中 ， 我 们 称 之 为 事务 处 理 ( transaction processing)。 而 操作 系统 中 按照 这 
样 的 一 种 方式 运作 的 文件 系统 被 称 为 日 志 式 文件 系统 ( log-based file system 或 log-structured 
file system 或 journaling file system， 末 者 简 记 作 JFS) 或 事务 型 文件 系统 (transactional file 
system)。 在 此 类 系统 中 ,任何 时 候 有 元 数据 被 更 新 ， 系 统 都 将 首先 写 一 条 记录 到 日 志文 件 
以 描述 即将 进行 的 所 有 更 新 操作 。 每 当 系 统 启动 时 ， 其 都 会 检查 日 志文 件 ， 以 确认 是 否 存在 
悬而未决 ( 即 挂 起 而 未 完成 ) 的 事务 。 如 果 有 这 样 的 事务 ， 系 统 就 会 检查 确认 有 关 事 务 的 所 
有 步骤 是 否 均 已 成 功 地 付 诸 实 施 。 而 如 果 没 有 全 部 付 诸 实 施 ， 那 么 系统 就 会 尝试 完成 有 关 事 
务 。 如 果 可 以 完成 ， 那么 一 切 都 很 正常 ， 意 味 着 我 们 已 经 躲 过 了 一 动 。 但 如 果 有 关 事 务 由 于 
某 种 原因 无 法 完成 ， 那么 相关 事务 就 会 中 止 和 取消 。 进 一 步 说 ,我 们 将 会 主动 丢弃 要 写 人 对 
应 文件 的 最 后 一 个 盘 块 的 数据 ， 但 是 这 样 一 来 ， 文 件 系统 就 不 会 受到 进一步 的 破坏 。 要 知 
道 ， 运 行 带 有 损坏 的 元 数据 的 文件 系统 的 后 果 将 是 灾难 性 的 。 

当然 ， 没 有 什么 事情 是 免费 的 ， 而 我 们 为 了 日 志 式 文件 系统 的 安全 性 所 需 付 出 的 代价 就 
是 性 能 上 的 损失 。 鉴 于 每 次 在 我 们 写 入 元 数据 之 前 ， 都 得 花费 时 间 来 写 入 事务 日 志 ， 所 以 我 
们 将 会 看 到 系统 性 能 有 所 下 降 。 此 外 ， 所 记录 的 事务 不 一 定 包 含有 实际 的 用 户 数据 ， 尽 管 某 
些 操作 系统 确实 在 有 关 事 务 中 包含 有 应 用 程序 的 相关 数据 。 另 一 方面 ， 如 果 一 个 系统 拥有 很 
多 文件 ,那么 一 旦 系统 发 生前 溃 ， 在 恢复 系统 操作 之 前 ， 我 们 必须 得 首先 执行 一 次 完整 的 文 
件 系统 扫描 来 验证 有 关 元 数据 的 完整 性 ， 而 在 一 台大 型 服务 器 上 这 可 能 差不多 得 耗费 上 好 几 
个 小 时 。 因 此 ， 为 了 时 时 刻 刻 保持 完整 性 ， 通 常情 况 下 ， 我 们 宁愿 选择 稍微 降低 系统 的 响应 
水 平 。 这 在 单 用 户 系统 中 尤其 如 此 ， 其 间 ， 在 用 户 敲 击 键盘 或 思考 问题 的 同时 ， 往 往 有 大 量 
空闲 的 处 理 器 时 间 和 磁盘 时 间 可 用 来 执行 此 类 任务 。 鉴 于 此 ， 最 近 几 年 开发 的 大 多 数 文件 系 
统 都 是 事务 型 文件 系统 ， 其 中 包括 用 于 OS/2 操作 系统 的 日 志 式 文件 系统 、 用 于 Mac 操作 系 
统 的 HFS Plus、 用 于 Windows NT 系列 操作 系统 的 NTFS 以 及 用 于 Linux 操作 系统 的 许多 文 
件 系统 ， 包 括 Ext3 (第 三 代 扩 展 文件 系统 )、ReiserFS、XFS 和 JFS。 
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13.8 小结 


在 第 12 章 中 ,我 们 讨论 了 文件 系统 的 概念 以 及 它们 是 如 何 融 人 操作 系统 里 的 ， 包 括 许 
多 可 能 的 备 选 设计 方案 。 对 于 真实 的 文件 系统 而 言 ， 则 往往 反映 了 其 中 所 包含 的 相关 机 制 的 
设计 选择 。 为 此 ,我 们 研究 了 现代 操作 系统 中 的 文件 系统 的 几 个 案例 。 这 些 简 明 扼要 的 概述 
说 明了 一 些 现代 的 操作 系统 是 如 何 运用 前 一 章 所 讨论 的 相关 机 制 的 。 接 下 来 ,我 们 从 挂 载 文 
件 系统 开始 ， 依 次 讨论 了 与 文件 系统 相关 的 其 他 问题 。 我 们 围绕 诸如 虚拟 文件 系统 和 相关 概 
念 背 后 的 原因 以 及 内 存 映射 文件 的 目的 等 进行 了 专题 讨论 。 我 们 介绍 了 操作 系统 必须 提供 和 
用 来 管理 文件 系统 信息 的 一 些 实用 程序 。 之 后 ， 我 们 还 阐述 了 事务 型 文件 系统 或 日 志 式 文件 
系统 技术 背后 的 主要 思想 ， 正 是 相关 技术 才 铸 就 了 更 为 可 靠 的 文件 系统 。 
在 下 一 章 中 ,我 们 将 介绍 低级 的 输入 /输出 系统 ， 其 中 主要 是 磁盘 操作 调度 。 295 
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为 什么 FAT12 系统 设计 采用 了 如 此 短小 的 指针 ? 
文件 分 配 表 组 织 不 需要 任何 单独 的 机 制 来 监测 空闲 空间 。 为 什么 ? 
在 Windows 操作 系统 的 NTFS 文件 系统 中 ， 一 


个 文件 的 目录 项 中 可 能 不 包含 指向 相应 文件 的 数 


13.4 为 什么 UNIX /Linux 操作 系统 的 索引 结 点 不 包含 文件 名 ? 

13.5 操作 系统 在 什么 时 候 挂 载 位 于 可 移动 磁盘 驱动 器 上 的 文件 系统 ? 

13.6 ”为 什么 光盘 的 挂 载 不 同 于 可 移动 磁盘 驱动 器 ? 

13.7” 当 操作 系统 挂 载 了 一 个 远程 文件 系统 时 ， 远 程 文件 系统 是 如 何 呈 现在 用 户 和 应 用 程序 面前 的 ? 
13.8 


的 目的 。 这 一 目的 是 什么 ? 
13.9 


虚拟 文件 系统 层 曾 经 被 用 来 支持 访问 远程 文件 系统 。 然 而 ， 虚 拟 文件 系统 层 拥有 一 个 更 为 通用 


简要 描述 内 存 映射 文件 比 正常 输入 /输出 更 为 高 效 的 原因 。 


13.10 在 13.6 节 ， 我 们 曾 提 及 某 些 实用 例 程 命令 并 没有 以 实用 程序 的 形式 存在 于 系统 上 。 这 是 为 什么 ? 


13.11 
的 解释 说 明 。 


如 果 声 称 一 个 文件 系统 是 事务 型 的 或 者 是 基于 日 志 的 ， 这 将 意味 着 什么 ? 请 就 此 进行 简明 扼要 
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Operating Systems: A Spiral Approach 


磁盘 调度 和 输入 / 输出 管理 





14.1 引言 


在 上 一 章 中 ， 我 们 从 用 户 或 应 用 程序 设计 人 员 的 角度 审视 了 输入 与 输出 一 一 操作 系统 给 
上 层 模 块 提供 了 哪些 功能 和 服务 ? 完成 相关 服务 需要 什么 样 的 数据 结构 ? 有 关 功 能 是 如 何 执 
行 的 ? 在 这 一 章 中 ,我 们 将 会 进一步 去 审查 这 些 功 能 和 服务 在 低层 是 如 何 实现 的 。 特 别 地 ， 
任何 文件 系统 的 最 底层 都 是 由 一 组 设备 驱动 程序 和 中 断 处 理 程序 所 构成 的 。 在 前 面 的 章节 
中 ， 我 们 曾经 讨论 了 输入 /输出 功能 是 如 何 从 简单 的 设备 和 结构 起 步 而 逐渐 发 展 成 为 更 加 复 
杂 的 系统 和 服务 。 本 章 中 ， 我 们 将 会 近 距 离 地 来 观察 和 研究 现代 的 硬件 设备 以 及 对 它们 进行 
有 效 而 经 济 的 管理 所 必需 的 操作 系统 组 织 方式 。 

在 第 14.1 节 中 ， 我们 将 介绍 低级 输入 /输出 管理 的 问题 ， 特 别 关注 的 是 辅助 存储 器 和 磁 
盘 驱动 器 。 接 着 ， 在 第 14.2 节 ， 我 们 将 会 讨论 输入 /输出 设备 的 一 些 大 致 分 类 以 及 彼此 之 间 
的 区 别 。 在 第 14.3 节 ， 我 们 则 会 描述 一 些 用 来 支持 输入 /输出 设备 的 通用 的 技术 。 然 后 ， 在 
第 14.4 节 ， 我 们 将 探索 磁盘 驱动 器 的 物理 结构 ， 并 在 第 14.5 节 讨 论 存储 在 磁盘 驱动 器 上 的 
信息 的 逻辑 组 织 方式 。 在 第 14.6 节 中 ,我们 将 着 重 介绍 廉价 磁盘 元 余 阵 列 ， 其 通过 以 特殊 
的 构 型 对 磁盘 进行 装配 ， 从 而 能 够 获得 更 大 的 吞吐 量 和 更 高 的 可 靠 性 。 关 于 非常 重要 的 磁盘 
调度 操作 及 性 能 优化 的 话题 ， 将 会 在 第 14.7 节 中 展开 讨论 。 在 第 14.8 节 中 ， 我们 将 会 介绍 
一 种 所 谓 内 存 直接 存 取 ( Direct Memory Access，DMA) 控制 器 的 特殊 类 型 的 设备 控制 器 ， 
其 可 以 显著 地 减少 由 于 输入 /输出 操作 而 带 来 的 处 理 器 负载 。 该 节 还 会 讨论 影响 操作 系统 行 
为 的 磁盘 驱动 器 的 一 些 特 性 。 最 后 ， 在 第 14.9 节 ， 我 们 将 对 这 一 章 的 内 容 进行 归纳 总 结 。 


14.2 设备 特性 
通过 对 输入 /输出 设备 进行 分 门 别 类 ， 可 以 笼统 地 把 它们 划分 成 操作 系统 区 别处 理 的 若 


干 分 组 。 我 们 在 这 里 讨论 其 中 的 几 种 分 类 方法 及 相应 的 设备 类 别 。 


14.2.1 ”随机 存 取 与 顺序 存 取 


在 这 一 章 ， 我 们 几乎 只 关注 辅助 存储 设备 ， 尤 其 是 磁盘 驱动 器 。 磁 带 曾 经 一 度 被 用 作 
大 型 计算 机 中 的 辅助 存储 器 。 当 个 人 计算 机 最 初 被 开发 出 来 时 ， 它 们 也 经 常 把 磁带 驱动 右 作 
为 唯一 的 辅助 存储 设备 一 一 具体 为 原先 开发 用 来 保存 音频 的 四 分 之 一 英寸 规格 的 盒 式 磁带 驱 
动 器 。 不 过 ， 磁 带 有 一 项 令 人 遗憾 的 特征 ， 即 它们 不 能 支持 数据 的 随机 读 取 。 为 了 到 达 和 获 
取 磁 带 上 任意 一 个 特定 的 数据 片段 ， 都 必须 穿越 从 磁头 当前 所 在 位 置 到 所 访问 数据 位 置 之 间 
的 所 有 的 其 他 数据 。 即 便 是 在 速度 非常 快 的 磁带 驱动 器 上 ， 这 也 可 能 需要 花 上 好 几 分 钟 的 时 
间 。 幸 运 的 是 ， 磁 盘 驱动 器 没有 此 类 特征 。 也 正 是 由 于 存在 这 个 不 同 ， 我 们 才 提 及 磁盘 驱动 
器 是 “随机 存 取 ” 设 备 。 尽 管 如 此 ， 当 后 面 我 们 对 磁盘 驱动 器 展开 详细 介绍 的 时 候 ， 我 们 就 
会 明白 ， 这 并 不 意味 着 它 存 取 数 据 所 耗费 的 时 间 是 独立 于 数据 的 存储 位 置 的 。 这 一 术语 仅仅 
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是 反映 了 把 磁盘 驱动 器 作为 辅助 存储 器 和 采用 磁带 驱动 器 作为 主要 的 辅助 存储 设备 形成 的 对 
照 中 所 凸现 出 来 的 差异 。 
14.2.2 ”设备 分 类 


大 多 数 的 操作 系统 都 将 设备 大 致 地 划分 为 三 种 类 别 : 块 设备 、 字 符 设备 和 网 络 设备 。 其 
中 每 一 类 设备 都 拥有 与 其 他 设备 存在 根本 区 别 的 特征 ， 而 且 每 一 类 设备 都 可 以 按照 一 种 有 意 
义 的 方式 来 进行 抽象 。 表 14-1 给 出 了 关于 这 些 设备 类 别 的 一 些 信 息 。 


表 14-1 Linux 设备 类 别 的 特征 


EIT 


5 
ET 





块 设备 

对 于 块 设备 (block device)， 每 次 会 读 取 或 写 入 一 个 盘 块 的 数据 (一 组 字 节 ， 通 常 是 512 
字 节 的 倍数 )。 例 如 ， 各 式 各 样 的 磁盘 驱动 器 和 磁带 驱动 器 就 是 这 样 的 设备 。 其 间 ， 盘 块 的 
大 小 在 一 定 程 度 上 是 由 硬件 来 决定 的 ， 因 为 磁盘 控制 器 只 能 够 读 取 或 写 人 完整 的 磁盘 扇 区 ， 
但 是 ， 在 设置 文件 系统 的 时 候 ， 盘 块 的 大 小 也 可 由 系统 管理 员 来 确定 。 一 般 情况 下 ， 盘 块 大 
小 是 物理 扇 区 大 小 的 某 个 小 的 倍数 一 一 最 典型 的 为 4KB 或 8KB。 这 些 设备 往往 支持 对 它们 
上 面 的 任何 盘 块 进行 直接 的 随机 存 取 ， 也 就 是 说 ， 可 以 按照 任何 次 序 来 读 取 或 写 人 盘 块 内 
容 。 文 件 系 统 通常 位 于 块 设备 上 ， 而 且 是 用 于 访问 这 些 设备 的 常规 机 制 。 对 于 随机 访问 块 结 
构 的 设备 而 言 ， 常 常设 立 有 高 速 缓存 机 制 。 同 时 ， 就 像 后 面 说 明 的 那样 ， 针 对 块 设备 的 顺序 
存 取 往往 会 采用 双 缓 冲 技术 。 少 数 情况 下 ， 一 些 软 件 需 要 直接 访问 这 些 块 设备 ， 而 不 是 通过 
使 用 文件 系统 来 进行 访问 ,这 就 是 所 谓 的 原始 输入 /输出 (Raw LO)。 此 类 软件 的 实例 包括 
用 于 维护 或 检查 文件 系统 自身 的 实用 程序 (譬如 ，Linux 和 UNIX 系统 的 fsck)， 以 及 对 辅助 
存储 器 有 特别 要 求 、 足 够 精致 和 包含 有 高 速 缓存 或 磁盘 调度 操作 的 首选 机 制 的 软件 (例如 ， 
要 求 近似 于 茄 刻 的 数据 库 服 务 器 )。 

字符 设备 

字符 模式 设备 ( character mode device)， 或 称 为 字符 设备 ( character device)， 每 次 仅 传 
输 一 字 节 的 数据 。 这 样 的 设备 包括 打印 机 、 键 盘 、 鼠 标 (以 及 其 他 的 指针 式 设 备 )， 等 等 。 
它们 支持 与 块 模式 文件 相同 类 型 的 大 多 数 的 基本 操作 ， 包 括 打 开 、 关 闭 、 读 、 写 等 。 而 为 了 
执行 一 个 不 适合 文件 系统 模型 语义 的 操作 (例如 ， 读 取 打 印 机 的 状态 )， 程 序 可 以 使 用 ioctl 
系统 调用 。 显 然 ， 字符 模式 设备 无 法 支持 逆向 查找 。 例 如 ， 我 们 不 能 读 取 从 键盘 上 输入 的 
20 个 字符 之 前 的 那个 字符 ， 也 无 法 读 取 打 印 在 前 一 页 上 的 字符 。 不 过 ， 一些 字符 设备 允许 
向 前 跳 过 若干 字符 。 但 是 ,字符 模式 设备 从 来 不 会 采用 高 速 缓存 机 制 ， 即 使 它们 可 能 拥有 一 
个 缓冲 区 。 

网 络 设备 

网 络 设备 (network device) 完全 不 适合 采用 传统 的 文件 操作 语义 。 其 问题 在 于 ， 等 待 源 
自 网 络 输入 的 应 用 程序 ， 永 远 不 会 知道 什么 时 候 数据 才能 输入 和 准备 好 ， 甚 至 都 无 法 知道 是 
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否 存 在 可 用 的 数据 。 一 家 公司 可 能 会 创建 一 个 网 站 ,并 对 通过 该 网 站 来 销售 各 种 的 小 型 应 用 
程序 抱 有 很 高 的 期 望 ， 但 是 其 网 站 却 可 能 从 来 没有 接收 到 哪怕 一 次 点 击 。 出 于 这 个 原因 ， 网 
络 设备 拥有 一 套 完全 不 同 于 块 设备 和 字符 设备 的 读 写 操作 的 接口 。 


14.3 输入 /输出 技术 


一 般 来 说 ,输入 /输出 系统 有 两 种 工作 方式 。 大 多 数 的 大 型 系统 往往 会 拥有 很 多 功能 在 
或 多 或 少 地 同时 运行 着 ,为 此 ， 能 够 有 效 处 理 这 些 功 能 的 唯一 的 途径 就 是 采用 第 2 章 中 所 描 
述 的 中 断 系统 。 与 此 同时 ， 另 一 种 所 谓 轮 询 〈polling) 的 方法 则 常常 用 在 装 有 低 功 耗 类 型 的 
处 理 器 的 小 型 系统 中 。 在 轮 询 系统 中 ， 操 作 系统 对 设备 的 控制 被 编写 在 唯一 的 一 个 大 的 循 
环 结构 体 里 ， 其 间 ， 操 作 系 统 将 依次 检查 每 台 设 备 的 状态 ， 并 查看 确认 对 应 设备 是 否 需要 处 
理 。 这 项 技术 往往 用 在 家 入 式 设备 或 简单 的 手持 式 游戏 系统 上 ， 它 们 通常 只 有 少量 的 可 用 设 
备 ， 依 次 检查 相关 设备 要 比 设置 中 断 体系 结构 简单 ， 而 且 还 能 够 避免 承受 涉及 中 断 服务 的 上 
下 文 切换 所 带 来 的 开销 。 

输入 / 输出 系统 中 的 通用 技术 

在 输入 /输出 系统 中 ， 常 常会 采用 若干 通用 技术 。 在 深入 研究 输入 /输出 系统 的 其 他 细 
节 之 前 ,我们 首先 来 了 解 一 下 其 中 的 一 些 通用 技术 。 


14.3.1 缓冲 技术 


当 我 们 向 计算 机 系统 输入 数据 的 时 候 ; 我 们 通常 是 从 一 台 设 备 读 出 数据 ， 然 后 再 写 人 另 
一 台 设 备 中 。 例如 ， 当 一 个 用 户 正在 通过 键盘 输入 方式 编写 一 个 文档 时 ， 计算机 其 实 是 把 文 
档 写 入 磁盘 中 。 另 一 个 极端 的 例子 是 ,我 们 可 能 会 将 我 们 的 硬盘 内 容 备 份 到 一 台 磁 带 驱 动 器 
上 。 上 述 任何 情况 ,我 们 都 会 用 到 一 种 所 谓 缓冲 ( buffering) 的 技术 。 缓冲 区 是 内 存 的 一 部 
分 ,其 中 存放 了 我 们 即将 在 输入 /输出 操作 中 使 用 的 记录 。 关 于 我 们 为 什么 要 使 用 缓冲 区 ， 
存在 诸多 的 理由 支持 。 首 先 可 能 是 因为 要 传输 的 数据 的 大 小 。 用 户 编写 文档 时 ， 每 次 只 会 产 
生 唯 一 的 一 个 字符 ， 然 而 ， 我 们 却 和 不 能 往 磁 盘 中 只 写 人 一 个 字符 。 对 于 磁盘 存 取 数 据 的 最 小 
单位 是 扇 区 。 像 磁盘 和 磁带 这 样 的 块 设备 只 能 以 大 的 盘 块 来 进行 数据 的 传输 。 因 此 ， 我 们 要 
用 一 个 缓冲 区 来 暂 存 用 户 输入 的 那些 字符 ， 直 到 我 们 拥有 足够 的 字符 可 以 填 满 一 个 肩 区 时 ， 
我 们 再 把 该 扇 区 的 数据 写 人 磁盘 ， 然 后 开始 另外 一 个 新 的 扇 区 的 存 取 操作 。 

在 这 种 特定 的 场景 中 ,磁盘 的 存 取 速度 可 能 足以 快 到 使 我 们 在 下 一 个 按键 可 能 到 达 之 
前 ， 就 能 够 把 缓冲 区 中 的 全 部 数据 写 到 磁盘 上 ， 从 而 腾空 缓冲 区 使 其 可 以 接收 下 一 个 按键 信 
息 。 但是, 假设 设备 之 间 的 速度 差别 很 小 一 一 比如 说 3 或 4 信 ， 在 这 种 情况 下 ,我们 就 可 能 
需要 采取 一 种 稍微 不 同 的 技术 ， 即 双 缓 冲 ( double buffering) 技术 。 我 们 将 会 为 相应 的 进程 
分 配 两 个 缓冲 区 。 我 们 首先 应 填 满 其 中 的 一 个 缓冲 区 ， 然 后 开始 把 此 缓冲 区 中 的 内 容 写 到 
输出 设备 上 = 而 在 我 们 开始 写 设备 操作 的 同时 ， 我 们 就 可 以 开始 使 用 第 二 个 缓冲 区 来 存放 
输入 的 数据 。 当 第 二 个 缓冲 区 盾 满 的 时 候 ， 第 一 个 缓冲 区 的 写 设 备 操作 就 应 该 完成 了 ， 于 
是 ,我 们 就 可 以 开始 将 第 二 个 缓冲 区 的 数据 写 到 输出 设备 上 ， 同 时 开始 再 次 把 输入 数据 填 入 
第 一 个 缓冲 区 中 。 图 14-1 就 显示 说 明了 这 个 过 程 。 在 图 14-1a 中 ,我 们 可 以 看 到 进程 A 正 
在 向 1 号 缓冲 区 填 人 数据 ， 而 2 号 缓冲 区 正在 等 待 。 在 图 14-1b 中 ， 进 程 A 已 经 填 满 了 1 号 
缓冲 区 ， 因 此 进程 A 就 向 2 号 缓冲 区 填 人 数据 ， 同 时 把 工 号 缓冲 区 中 的 数据 写 人 磁盘 驱动 
加 
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1 号 
缓冲 区 
EE 
2 号 2 号 
缓冲 区 缓冲 区 


a) 进 程 A 正 在 向 1 号 缓冲 区 b) 进 程 A 正 在 向 2 号 缓冲 区 填 人 
填 人 数据 ， 而 2 号 缓冲 区 数据， 而 1 号 缓冲 区 中 的 数据 
正在 等 待 正在 被 写 入 输出 设备 上 


图 14-1 双 缓 冲 技 术 应 用 示例 


我 们 使 用 缓冲 区 的 男 一 个 原因 可 能 是 ,我 们 正在 处 理 的 两 台 设 备 都 是 块 存 取 设 备 ,， 但 是 
这 两 台 设备 却 拥 有 不 同 的 数据 块 大 小 。 例 如 ,以 太 网 适配器 通常 传输 的 最 大 数据 块 的 大 小 大 
约 是 1500 字 节 ， 而 令 牌 环 适 配器 则 允许 传输 最 大 约 为 18 000 字 节 的 数据 块 。 如 果 要 将 一 个 
数据 包 从 令 牌 环 连接 传输 到 以 太 网 连接 ,我们 就 不 得 不 使 用 缓冲 区 来 保存 令 牌 环 数据 包 ， 同 
时 这 个 令 牌 环 数据 包 拆 分 成 多 个 以 太 网 数据 包 然 后 再 发 送出 去 。( 相 关 活 动 还 牵涉 其 他 复杂 
情况 ,不 过 它们 已 经 超出 了 本 书 的 范围 ， 所 以 我 们 就 不 展开 了 .) 


14.3.2 ”高 速 缓存 技术 


高 速 缓存 〈caching) 是 计算 机 系统 中 最 具 深 远 意 义 的 技术 之 一 。 该 项 技术 在 无 论 硬件 还 
是 软件 中 都 得 到 了 运用 。 其 目的 是 使 一 个 容量 较 大 、 速 度 较 慢 但 却 比较 便宜 的 内 存 ， 看 起 来 
能 够 以 与 容量 较 小 、 速 度 较 快 因而 比较 昂贵 的 内 存 相同 的 速度 运行 。 就 像 第 2 章 和 第 11 章 
中 所 讨论 的 那样 ， 高 速 缓存 之 所 以 能 够 发 挥 作用 ， 是 因为 进程 实际 上 并 不 会 随机 地 访问 内 
存 。 相 反 ， 进程 是 基于 引用 的 局 部 性 原理 来 运作 的 。 这 一 原理 表明 ， 与 不 接近 那些 已 经 引用 
过 的 地 址 的 内 存 地 址 相 比 ， 一 个 进程 更 可 能 去 引用 靠近 那些 已 经 引用 过 的 地 址 的 内 存 地 址 。 
例如 ， 一 个 进程 在 大 部 分 时 间 里 都 是 按 顺序 来 执行 指令 的 ， 而 不 是 以 分 支 跳 转 的 方式 随机 执 
行 指令 的 。 是 的 ， 常 常会 有 子 程序 的 调用 ， 但 一 般 需要 许多 指令 来 准备 和 构建 下 一 次 的 子 程 
序 调 用 。 同 时 ， 进 程 往往 会 通过 扇 区 、 数 组 、 字 符 串 、 数 据 包 等 来 执行 线性 搜索 。 局 部 性 原 
理 的 另 一 方面 是 说 ， 一 旦 一 个 进程 引用 了 某 内 存单 元 ,那么 该 内 存单 元 被 对 应 进程 再 次 引 
用 的 可 能 性 要 远 远大 于 另外 一 个 随机 的 内 存单 元 被 对 应 进程 引用 的 可 能 性 。 再 者 ， 通 常情 况 
下 , 一 个 进程 可 能 会 花 上 一 段 时 间 来 初始 化 一 个 表 ， 或 者 访问 该 表 中 的 许多 字段。 


14.3.3 ”针对 短小 记录 的 分 块 技术 


最 后 一 种 用 在 输入 /输出 系统 的 通用 技术 是 分 块 (blocking) 技术 。 分 块 就 是 将 若干 条 
逻辑 记录 打包 成 一 个 物理 块 写 到 一 台 设 备 上 ， 它 有 点 类 似 于 不 同 块 大 小 的 设备 之 间 的 缓冲 技 
术 。 让 我 们 来 考虑 原先 设计 是 使 用 穿孔 卡片 但 却 被 转换 为 运行 在 磁带 上 的 一 个 系统 。 记 录 编 
排 可 能 都 很 接近 于 穿孔 卡片 的 大 小 ， 即 80 个 字符 。 当 然 ， 往 一 人 台 磁 带 驱 动 器 上 写 80 字 节 的 
记录 是 可 能 的 ， 但 是 其 效率 却 不 会 很 高 。 各 磁带 记录 之 间 有 一 个 间隙 ， 可 为 磁带 驱动 器 留 出 
相应 的 时 间 ， 用 于 把 磁带 驱动 到 合适 的 速度 进而 把 磁带 停 在 记录 之 间 。 这 个 间隙 可 以 容纳 许 
多 大 小 为 80 个 字符 的 记录 ， 故 而 会 对 磁带 造成 大 量 的 浪费 。 只 是 通过 把 10 条 记录 打包 成 一 
个 数据 块 ， 并 通过 一 次 操作 把 该 数据 块 写 到 磁带 上 ， 我们 就 会 节省 出 相当 可 观 的 空间 。 术 语 
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“分 块 ” 的 类 似 的 运用 是 在 磁盘 文件 系统 中 ， 我 们 经 常会 分 配 千 干 个 扇 区 作为 一 个 单独 的 数 
据 块 。 之 所 以 要 采用 这 项 技术 ， 只 是 因为 我 们 的 文件 系统 的 指针 不 够 大 ， 故 而 无 法 寻 址 到 某 
些 新 型 的 大 容量 磁盘 驱动 器 上 的 所 有 的 扇 区 ， 所 以 我 们 只 好 一 次 分 配 多 个 请 区 。 尽 管 如 此 ， 
在 正常 情况 下 ， 我 们 仍然 是 按 单独 唯一 鹿 区 的 方式 来 读 写 磁盘 驱动 融 的 。 


14.4 ”磁盘 物理 组 织 


在 我 们 讨论 控制 磁盘 驱动 器 的 软件 之 前 ， 我 们 先 来 复习 一 下 硬件 设计 的 相关 内 容 ， 特 别 
是 磁盘 物理 组 织 ， 以 便 我 们 能 够 搞 清 楚 硬件 的 特性 是 如 何 支配 某 些 软件 设计 的 。 


14.4.1 扇 区 、 磁 道 、 柱 面 及 磁头 


在 第 3 章 中 ， 我 们 在 图 3-2 中 展示 了 一 张 软盘 。 硬 盘 也 是 类 似 的 ， 在 图 14-2 中 ,我 
们 揭示 了 一 些 其 他 的 概念 。 在 图 中 ,我 们 可 以 看 到 两 个 盘 片 (platter) 堆放 在 同一 根 主轴 
( spindle) 上 ， 从 而 使 它们 可 以 一 起 旋转 。 有 4 个 传动 手臂 (或 称 之 为 磁 臂 ) 伸 到 了 这 两 个 盘 
片上 ， 且 每 一 个 传动 手臂 包含 有 一 个 读 写 磁头 。 传 动手 臂 可 以 沿 盘 片 半径 方向 在 盘 片 上 移 进 
和 移出 。 当 传动 手臂 在 任何 给 定位 置 固定 好 之 后 ， 盘 片 就 会 旋转 ， 这 样 磁盘 表面 的 一 圈 就 会 
从 磁头 下 方 通过 ， 这 一 圈 被 称 为 一 个 磁道 (track)。4 个 传动 手臂 是 连 在 一 起 的 ， 因 而 它们 
就 可 以 作为 一 个 部 件 一 起 移 进 和 移出 了 。 这 就 意味 着 在 无 须 移动 传动 手臂 的 情况 下 ， 磁 盘 驱 
动 器 可 以 同时 读 取 4 个 磁道 的 数据 ， 其 中 每 个 磁道 对 应 一 个 磁头 和 一 个 盘面 。 这 组 磁道 被 称 
作 一 个 柱 面 (cylinder)。 当 然 ， 如 果 有 更 多 的 盘 片 和 更 多 的 磁头 ,那么 在 一 个 柱 面 上 就 会 有 
许多 的 磁道 。 一 操 16 个 盘 片 堆 释 在 同一 根 主 轴 上 ,， 大 概算 得 上 是 在 现代 驱动 器 上 发 现 的 最 
多 的 盘 片 数 。 





图 14-2 硬盘 


一 个 磁道 从 逻辑 上 可 以 划分 为 若干 个 扇 区 ( sector)。 正 如 我 们 在 前 面 所 提 到 的 那样 ， 磁 
盘 驱 动 器 是 块 设备 ， 所 以 它 只 能 传输 一 个 完整 的 数据 单位 ， 而 不 是 按 单个 的 字符 来 进行 传 
输 的 。 扇 区 是 磁盘 驱动 器 所 能 传输 的 最 小 的 数据 单位 。 在 几乎 所 有 的 情况 下 ， 对 于 一 个 给 定 
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的 磁盘 驱动 器 来 说 ， 驱 动 器 上 的 所 有 扇 区 的 大 小 都 应 是 相同 的 。 在 大 多 数 现代 的 硬盘 驱动 器 
上 ， 这 些 扇 区 都 分 别 包 含 512 字 节 的 数据 ， 外 加 一 些 附加 信息 。 不 过 ， 也 有 一 些 其 他 可 用 的 
扇 区 大 小 ， 特 别 是 256 字 节 、1024 字 节 或 2048 字 节 。 扇 区 大 小 几乎 总 是 2 的 偶数 次 短 。 采 
用 ISO 9660 标准 的 光盘 ， 使 用 的 就 是 大 小 为 2048 字 节 的 数据 块 。 

这 样 来 装配 磁盘 驱动 器 的 硬件 ， 便 导致 了 可 由 柱 面 号 、 磁 头号 和 请 区 号 来 指定 的 磁盘 地 
址 的 概念 ， 或 称 之 为 柱 面 磁头 扇 区 编 址 ( CHS addressing， 或 称 为 CHS 编 址 )。 拥 有 C 个 柱 
面 、 互 个 磁头 且 每 个 磁道 包含 $ 个 扇 区 的 磁盘 ， 总 共 应 包含 有 CXHXS 个 扇 区 ， 通 常情 况 
下 可 存放 CXHXSX512 字 节 的 数据 。 例 如 ， 如 果 磁 盘 标 签 上 写 着 C/H/S=4 092/16/63 ， 那 么 
该 磁盘 就 会 有 4092X16X63=4 124 736 个 扇 区 ， 故 而 可 以 存放 4 124 736X512=2 111 864 832 
字 节 (2.11GB) 的 数据 。 


14.4.2 ” 扇 区 分 组 区 和 扇 区 编 址 


一 个 磁道 上 能 够 存储 的 二 进 制 位 的 数量 与 磁头 通过 的 线性 距离 是 成 正比 的 。 硬 盘 驱动 器 
以 恒定 的 速度 进行 旋转 ， 而 外 层 磁道 的 周 长 要 比 内 层 磁道 的 周 长 大 ， 因 此 ， 按 理 说 在 外 层 磁 
道上 能 够 存储 比 在 内 层 磁 道上 更 多 的 信息 。 但 是 ， 旧 式 的 磁盘 驱动 器 对 所 有 的 磁道 都 采用 了 
相同 的 定时 ( 译 者 注 : 由 此 导致 了 所 有 磁道 上 存储 的 信息 量 都 是 一 样 的 )， 所 以 在 外 层 磁道 
上 的 二 进 制 位 要 比 在 内 层 磁道 上 的 二 进 制 位 长 些 ， 这 可 能 是 对 二 进 制 位 的 极 大 浪费 。 伴 随时 
间 的 推移 和 技术 的 进步 ， 磁 盘 驱 动 器 的 电子 器 件 已 变 得 越 来 越 复杂 ， 现 在 的 驱动 器 甚至 还 包 
含有 一 个 独立 的 计算 机 。 为 此 ， 自 20 世纪 90 年 代 中 期 以 来 生产 的 大 多 数 的 磁盘 驱动 器 都 采 
用 了 一 种 近 然 不 同 的 称 之 为 区 位 记录 ( Zone Bit Recording，ZBR) 的 定时 技术 。 其 间 ， 磁 盘 
磁道 被 划分 成 具有 同样 大 小 的 磁道 区 (或 称 之 为 扇 区 分 组 区 )， 并 要 求 在 各 磁道 区 的 磁道 之 
间 跨 越 时 调整 定时 ( 译 者 注 : 不 同 的 磁道 区 设立 不 同 的 定时 )。 这 样 ， 外 层 磁道 区 的 磁道 上 
就 可 以 设立 更 多 的 扇 区 ， 而 内 层 磁道 区 的 磁道 上 设立 的 肩 区 数 就 要 相对 少 一 些 。 

鉴于 各 磁道 上 的 扇 区 数 对 于 整个 驱动 器 来 说 不 再 是 常量 ， 采 用 CHS 格式 编 址 扇 区 的 想 
法 也 就 不 再 能 够 正常 发 挥 效用 了 ， 所 以 某 些 东西 必须 要 进行 修正 。 但 是 因为 某 些 软件 在 很 大 
程度 上 是 面向 CHS 概念 的 ， 所 以 期 望 尽量 保持 或 尽 可 能 地 接近 相关 格式 。CHS 格式 的 磁盘 
地 址 共 24 位 ， 具 体 按 如 下 方式 划分 成 三 部 分 : 


柱 面 号 0~1023 (10 位 ) 
磁头 号 0~254 (8 位 ) 
肩 区 号 1~63 《6 位 》 


因此 ， 可 以 用 CHS 编 址 方式 表示 的 最 大 的 磁盘 地 址 是 8 GiB ( 译 者 注 : 准确 地 讲 ，GiB 
表示 2” 字 节 ， 而 GB 表示 10? 字 节 )。 为 了 遵循 旧式 驱动 器 的 接口 设计 模式 ， 新 式 的 驱动 
器 继续 采用 了 CHS 编 址 方式 ， 同 时 需要 告知 操作 系统 其 拥有 一 些 非常 大 的 柱 面 数 、 磁 头 数 
和 扇 区 数 。 驱 动 器 将 会 获取 到 相关 参数 ， 并 计算 出 一 个 逻辑 块 地 址 ( Logical Block Address， 
LBA)。 这 仅仅 意味 着 磁盘 的 遍 区 是 从 0 开始 顺序 编号 的 ， 而 且 每 个 扇 区 都 通过 其 LBA 编 
号 来 进行 标识 。 在 此 基础 上 ， 了 驱动 器 将 根据 各 磁道 区 中 的 相应 的 扇 区 数 进一步 计算 目标 块 的 
实际 物理 地 址 。 为 支持 操作 系统 无 须 在 这 种 人 为 的 CHS 格式 上 耗费 精力 和 直接 传人 LBA 地 
址 , 已 经 开发 出 了 相应 的 基本 输入 /输出 系统 (BIOS) 例 程 和 驱动 器 。 

然而 到 后 来 ， 驱 动 器 容量 变 得 大 到 连 能 够 指定 的 最 大 的 LBA 地 址 都 不 足以 寻 址 到 整个 
的 磁盘 驱动 器 了 。 为 了 能 够 容纳 和 适应 这 些 更 大 的 驱动 器 ,， 于 是 提出 了 新 的 地 址 格式 以 支持 
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28 位 或 48 位 的 地 址 的 使 用 。 这 样 ， 假 定 每 个 扁 区 为 标准 的 512 字 节 ， 则 磁盘 大 小 的 上 限 可 
以 达到 128 GiB 或 128 PiB ( 译 者 注 : PiB 表示 2” 字 节 )。 


14.4.3 ”低级 格式 化 

当 磁 盘 驱 动 器 最 初生 产 出 来 的 时 候 ， 它 们 并 不 包含 任何 的 信息 ， 就 连 我 们 想 要 访问 的 扇 
区 也 不 存在 。 这 时 候 ， 必 须要 调用 一 种 特殊 的 写 操 作 模 式 ， 让 磁盘 把 定义 了 扇 区 位 置 的 字 节 
数据 真正 地 写 到 磁盘 上 。 这 种 特殊 的 写 操作 模式 就 称 为 低级 格式 化 ( low-level formatting)。 
于 是 ， 每 一 个 鹿 区 都 将 会 包含 一 个 用 来 标识 该 鹿 区 的 柱 面 号 、 磁 头号 及 而 区 号 的 所 谓 扇 区 首 
部 。 一 开始 扇 区 是 空 的 ， 其 中 没有 信息 ， 同 时 会 附 有 一 个 校 验 和 。( 关 于 校 验 和 的 更 多 信息 
将 在 14.5.3 节 中 进行 介绍 。) 对 于 旧式 的 驱动 器 技术 ， 会 要 求 用 户 来 完成 此 类 的 低级 格式 化 。 
但 值得 庆幸 的 是 ， 现 在 磁盘 的 低级 格式 化 都 是 由 制造 商 来 完成 的 。 


14.4.4 速度 : 寻 道 、 传 输 及 缓冲 


硬盘 的 寻 道 时 间 ( seek time) 是 操作 系统 性 能 的 最 重要 的 因素 之 一 。 它 是 指 磁 盘 驱 动 器 
把 磁头 组 件 从 一 个 磁道 (或 柱 面 ) 移动 到 另 一 个 磁道 (或 柱 面 ) 所 花费 的 时 间 。 在 大 多 数 现 
代 的 系统 中 ， 处 理 器 在 大 部 分 时 间 里 都 是 空闲 的 ， 其 需要 等 待 磁盘 驱动 器 为 其 传输 其 所 需要 
的 信息 。 存 取信 息 所 用 时 间 最 大 的 影响 因素 在 于 要 让 读 写 磁头 实际 移动 和 放置 到 扁 区 对 应 的 
位 置 上 。 寻 道 时 间 的 度量 有 若干 种 可 能 的 方法 。 我 们 感 兴趣 的 度量 方法 是 平均 寻 道 时 间 ， 但 
是 为 简便 起 见 ， 我 们 就 称 之 为 寻 道 时 间 ， 因 为 平均 寻 道 时 间 已 经 成 为 用 来 说 明 磁 盘 驱 动 器 性 
能 的 一 个 行业 标准 了 。 抛 开 这 个 领域 的 一 些 早 期 的 发 展 来 看 ， 磁 盘 驱 动 器 的 寻 道 时 间 的 变化 
非常 小 。 每 年 的 变化 率 大 约 为 -8% 左右 ， 照 这 样 计算 ，10 年 总 共 降 低 了 50%。 在 过 去 的 30 
年 里 ， 这 一 判断 还 是 相当 准确 的 。 现 如 今 ， 一 般 的 消费 者 的 驱动 器 的 平均 寻 道 时 间 大 约 是 
6 一 12ms， 而 最 高 性 能 的 驱动 器 的 平均 寻 道 时 间 则 大 约 是 其 一 半 左 右 ， 即 降低 到 大 约 3ms。 

旋转 延迟 时 间 是 与 操作 系统 性 能 相关 的 因素 之 一 。 假 设 我 们 正在 查找 一 个 特定 的 月 区 ， 
于 是 我 们 首先 会 查找 正确 的 磁道 。 当 磁头 组 件 到 达 对 应 的 磁道 的 时 候 ， 它 就 会 停 下 来 。 一 个 
人 磁道 上 有 好 多 肩 区 ， 而 我 们 只 是 查找 其 中 特定 的 那 一 个 肩 区 。( 我 们 可 能 要 传输 千 干 扇 区 的 
数据 ， 但 是 我 们 将 会 指定 从 某 一 特定 编号 的 扇 区 开始 数据 传输 。) 大 多 数 情 况 下 ， 下 一 个 即 
将 要 通过 磁头 的 局 区 并 不 是 我 们 正在 查找 的 那个 记 区 。 平 均 起 来 ， 在 一 半 的 旋转 时 间 里 我 们 
会 在 错误 的 地 方 ， 这 种 延迟 时 间 就 称 为 旋转 延迟 (rotational latency) 时 间 。 旋 转 延 迟 时 间 随 
旋转 速度 成 反比 变化 。 表 14-2 给 出 了 磁盘 驱动 器 的 最 常见 的 旋转 速度 以 及 与 之 相对 应 的 平 
均 旋 转 延 迟 时 间 。 


表 14-2 旋转 延迟 时 间 随 驱动 器 旋转 速度 的 变化 
主轴 转速 平均 旋转 主轴 转速 平均 旋转 
(RPM (每 分 钟 转 数 )) 延迟 时 间 (ms) (RPM (每 分 钟 转 数 ) ) 延迟 时 间 (ms ) 


7 200 


12 000 





10 000 


15 000 
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因为 监控 旋转 位 置 对 于 操作 系统 来 说 并 不 是 件 非常 容易 的 事情 ， 而 且 寻 道 时 间 是 如 此 之 
大 以 至 于 旋转 延迟 时 间 相 比 之 下 就 不 像 是 个 重要 的 影响 因素 ， 所 以 直到 最 近 之 前 ， 旋 转 延 迟 
时 间 在 很 大 程度 上 一 直 处 于 被 忽略 的 境地 。 但 是 ， 要 注意 ,现在 旋转 延迟 时 间 已 经 摆 到 了 和 
寻 道 时 间 几 乎 同等 重要 的 地 位 上 。 因 此 ， 旋 转 延 迟 时 间 已 开始 在 磁盘 调度 算法 中 受到 重视 和 
给 予 相应 的 考虑 。 在 本 章 后 面 的 部 分 ， 我 们 将 会 就 此 展开 进一步 的 阐述 。 


14.5 ”磁盘 逻辑 组 织 


通常 情况 下 ， 应 用 程序 把 辅助 存储 器 看 作 一 组 装 满 记录 的 文件 。 而 在 最 底层 ， 输 入 /输出 
系统 则 将 磁盘 驱动 器 看 成 是 大 量 的 扇 区 。 为 此 ， 有 必要 对 磁盘 驱动 器 上 的 信息 进行 一 些 最 基 
础 的 组 织 ， 以 便 使 输入 /输出 系统 能 够 找到 其 所 需要 的 信息 。 因 为 个 人 计算 机 非常 普及 ， 所 
以 在 此 我 们 主要 描述 个 人 计算 机 上 的 磁盘 驱动 器 的 组 织 情况 。 其 他 计算 机 平台 会 使 用 不 同 的 
组 织 方式 ,但 是 它们 往往 会 拥有 相似 的 元 素 。 


14.5.1 分 区 


当 IBM 公司 推出 他 们 的 第 一 台 个 人 计算 机 的 时 候 ， 那 台 计 算 机 甚至 都 没有 硬盘 选 
项 一 一 软盘 是 其 唯一 的 磁盘 介质 。 当 有 了 第 一 批 可 用 的 硬盘 的 时 候 ， 它 们 只 能 容纳 10MB 左 
右 的 信息 ， 而 且 使 用 的 是 我 们 曾经 在 上 一 章 讨论 过 的 一 种 称 之 为 FAT12 的 文件 系统 组 织 结 
构 。 没 用 多 长 时 间 ， 人 们 就 认识 到 这 种 文件 系统 不 会 支持 那些 新 的 很 快 能 够 买 得 到 的 驱动 器 
了 。 我 们 在 前 面 就 曾 讨论 过 基于 一 次 分 配 多 个 鹿 区 的 想法 作为 此 类 问题 的 一 种 解决 方案 。 另 
外 一 种 简单 的 解决 方案 是 允许 将 唯一 的 一 个 磁盘 驱动 器 划分 成 多 个 部 分 ， 同 时 将 每 个 部 分 都 
看 作 是 一 个 独立 的 驱动 器 ， 这样， 旧式 的 文件 系统 仍然 可 以 使 用 。 这 种 解决 方案 称 为 分 区 9 
( partitioning)。 由 DOS 系统 提供 的 所 谓 FDISK 的 实用 程序 可 用 于 把 磁盘 划分 成 若干 独立 的 
分 区 。 最 初版 本 的 FDISK 允许 将 一 个 驱动 器 划分 为 最 多 4 个 分 区 ， 且 其 中 只 能 有 一 个 分 区 
可 以 包含 一 个 可 引导 的 操作 系统 。 伴 随 Windows NT 一 同 发 行 的 新 版 的 FDISK， 则 允许 在 
一 个 驱动 器 上 定义 更 多 的 分 区 ， 并 且 人 允许 有 多 个 引导 分 区 (也 称 作 主 分 区 )。 这 是 向 前 迈 出 
的 很 大 的 一 步 ， 尽 管 对 于 那些 在 这 种 格式 改变 之 前 就 已 创建 的 旧式 的 操作 系统 来 说 ,会 存在 
不 兼容 的 问题 。 大 多 数 现代 的 操作 系统 都 支持 这 种 格式 的 扩展 分 区 表 。 因 为 这 类 实用 程序 并 
不 经 常 使 用 ， 而 且 也 没有 太 多 的 途径 来 进行 功能 的 增强 ， 所 以 曾 
经 有 一 段 时 间 ， 大 多 数 其 他 的 操作 系统 都 只 是 使 用 了 相同 的 实用 
程序 。 现 如 今 ， 大 多 数 的 操作 系统 都 提供 了 它们 自己 的 分 区 实用 
程序 ,并且 许多 分 区 实用 程序 都 拥有 图 形 化 用 户 界面 。 

事实 证 明 ， 创建 分 区 对 于 其 他 方面 来 说 也 是 一 项 很 有 用 的 技 
术 。 首 先 ， 这 是 允许 一 台 机 器 包含 两 种 不 同 操作 系统 的 一 种 简单 
直接 的 方法 ， 并 且 还 允许 每 个 操作 系统 都 认为 自己 可 以 唯一 地 控 
制 磁 盘 驱 动 器 。 在 图 14-3 中 ， 我 们 可 以 看 到 ， 一 个 磁盘 驱动 器 
被 划分 成 了 包含 有 3 种 不 同类 型 操作 系统 的 4 个 分 区 。 正 常情 况 图 14-3 包含 若干 不 同 的 分 
下 ， 每 个 分 区 都 会 包含 一 个 文件 系统 。 但 是 ， 分 区 的 另外 一 种 用 区 及 操作 系统 的 磁 
途 是 服务 于 那些 非常 专业 的 应 用 程序 ， 这 些 应 用 程序 想 要 管理 它 盘 驱 动 器 示例 





日 ”这 项 技术 并 不 是 起 源 于 个 人 计算 机 系统 。 该 技术 在 更 早 时 候 便 由 于 这 里 提 及 的 一 些 相 同 的 原因 而 已 经 用 
在 了 某 些 大 型 主机 系统 上 。 
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们 自己 的 输入 /输出 而 不 是 利用 操作 系统 提供 的 缺 省 的 面向 文件 的 输入 /输出 。 数 据 库 管理 
系统 可 能 就 是 这 样 的 一 个 例子 。 此 类 系统 针对 它们 期 望 看 到 的 特定 的 存 取 模式 做 了 大 量 的 优 
化 ， 因 此 ， 如 果 只 能 使 用 标准 的 操作 系统 的 文件 输入 /输出 ， 效 率 就 不 会 很 高 。 这 种 应 用 程 
序 接口 被 称 为 原始 输入 /输出 ， 其 允许 应 用 程序 把 分 区 看 成 是 可 以 被 随机 存 取 的 一 个 盘 块 数 
组 ， 而 不 是 通过 普通 的 文件 抽象 机 制 来 进行 访问 的 。 

但 是 到 了 后 来 ， 终 于 开发 出 来 了 新 的 拥有 更 大 指针 和 可 以 支持 特大 硬盘 的 文件 系统 。 一 
些 应 用 程序 需要 比 当 时 可 以 买 得 到 的 单个 硬盘 的 容量 还 要 大 的 文件 空间 ， 于 是 ， 分 区 机 制 又 
进行 了 逆向 的 处 理应 用 ， 人 允许 两 个 或 多 个 磁盘 通过 分 区 机 制 组 合 到 一 起 ， 从 而 在 操作 系统 上 
层 呈 现 为 一 个 单独 的 驱动 器 。 图 14-4 给 出 了 跨越 两 个 磁盘 驱动 器 的 单个 分 区 的 示例 。 


2 号 磁盘 
驱动 器 





图 14-4 “跨越 两 个 磁盘 驱动 器 的 单一 分 区 


14.5.2 引导 块 


在 第 3 章 中 ， 我 们 曾经 讨论 过 从 磁盘 驱动 器 启动 系统 的 概念 。 当 一 台 计 算 机 重新 启动 
的 时 候 ， 其 通常 会 试图 从 系统 上 的 一 个 或 多 个 设备 来 启动 操作 系统 。 大 多 数 的 个 人 计算 机 都 
包含 有 一 块 由 电池 供电 的 特殊 的 存储 器 ， 通 常 指 的 是 互补 金属 氧化 物 半 导体 存储 器 ( CMOS 
memory)， 有 时 也 指 基 本 输入 /输出 系统 (BIOS)。 在 这 个 存储 器 的 设置 中 ， 除 了 别 的 事项 
之 外 ， 将 可 以 指定 允许 系统 从 中 启动 的 一 组 不 同 的 设备 ， 且 系统 将 按照 指定 的 顺序 来 依次 尝 
试 从 这 些 设备 加 以 引导 和 启动 。 当 系统 试图 从 给 定 的 某 个 设备 启动 时 ， 对 应 设备 也 可 能 无 法 
完成 启动 工作 。 例 如 ， 一 个 软盘 驱动 器 或 一 个 光盘 驱动 器 里 可 能 没有 软盘 或 光盘 ， 或 者 一 个 
硬盘 驱动 器 可 能 没有 安装 过 操作 系统 。 如 果 操 作 系统 不 能 从 某 个 设备 启动 ， 那 么 它 将 会 试图 
从 下 一 个 设备 启动 。 如 果 所 有 这 些 指 定 的 设备 都 不 能 启动 操作 系统 ， 那 么 一 条 并 非 普 通用 户 
就 能 明白 的 诊断 错误 就 会 显示 在 计算 机 屏幕 上 上。 相反， 如 果 发 现 了 能 够 启动 操作 系统 的 一 个 
设备 ， 那 么 在 计算 机 硬件 只 读 存储 器 (ROM) 中 的 自 启动 程序 (或 称 为 自 举 程序 ) 就 会 从 该 
设备 加 载 第 一 个 扇 区 ， 并 开始 执行 包含 在 此 扇 区 中 的 代码 。 

无 论 分 区 怎样 建立 ， 关 于 硬盘 分 区 的 信息 都 会 存储 在 磁盘 上 的 第 一 个 物理 扇 区 中 的 某 
个 部 分 。 这 个 扇 区 称 为 磁盘 的 主 引 导 记 录 ( Master Boot Record，MBR ) 或 者 引导 块 (boot 
block)， 其 中 包含 有 分 区 表 (partition table)。 同 时 ， 引 导 块 中 还 包含 了 一 个 小 程序 ， 该 程序 
用 来 查看 分 区 表 ， 检 查 哪 个 分 区 是 当前 的 活动 分 区 ( active partition)， 并 进而 读 取 对 应 分 区 
的 第 一 个 扇 区 。 对 应 分 区 的 引导 扇 区 中 则 包含 有 男 外 的 一 个 小 程序 ， 用 来 读 取 存 储 在 该 分 区 
中 的 操作 系统 的 第 一 部 分 ( 译 者 注 : 一 般 用 来 完成 启动 初始 化 工作 ) 并 加 以 启动 执行 。 操 作 
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系统 的 第 一 部 分 将 会 读 取 内 核 部 分 ， 并 挂 载 相应 分 区 中 所 发 现 的 根 目录 结构 。 

当 操 作 系 统 把 自身 引导 装 人 内 存 之 后 ， 其 将 会 挂 载 其 在 引导 卷 上 所 发 现 的 文件 系统 。 挂 
载 文件 系统 的 详情 取决 于 操作 系统 及 引导 操作 系统 的 分 区 的 格式 。 另 外 ， 操 作 系统 也 可 以 挂 
载 其 他 的 分 区 。 


14.5.3 ”错误 检测 与 校正 


当 把 信息 写 到 一 个 硬盘 单元 里 时 ， 同 时 也 会 伴随 着 写 人 一 些 额外 的 信息 。 这 些 额 外 的 信 
息 是 用 来 检测 错误 的 ， 经 常 也 会 用 来 校正 错误 。 有 各 种 各 样 的 用 来 创建 和 使 用 这 些 信息 的 方 
案 ， 具 体 采 用 哪 种 方案 取决 于 相应 驱动 器 预计 出 现 的 错误 类 型 、 期 望 的 可 靠 程度 以 及 对 驱动 
器 的 预期 的 相对 价格 。 一 般 来 说 ， 越 精致 的 技术 往往 会 生产 出 越 可 靠 的 驱动 器 ， 但 同时 也 会 
要 求 越 复杂 的 计算 ， 因 而 在 磁盘 驱动 器 中 就 会 要 求 一 个 更 快 和 更 强大 的 处 理 器 。 此 外 ， 越 复 
杂 的 技术 往往 会 在 磁盘 上 存储 越 多 的 宛 余 信息 ， 从 而 导致 相应 磁盘 会 容纳 越 少 的 用 户 数据 。 
因此 ， 对 于 一 个 给 定 的 用 户 存 储 的 数据 量 而 言 ， 越 复杂 的 技术 将 需要 一 个 容量 越 大 的 驱动 
器 。 但 是 ， 错 误 校 正 技术 支持 制造 商 能 够 制造 出 速度 更 快 、 存 储 容量 更 大 且 在 用 户 看 来 没有 
差错 的 驱动 器 。 为 了 达到 相同 级 别 的 可 靠 程 度 ， 存 储 数据 的 技术 争取 的 越 多 ， 错 误 校正 机 制 
就 需要 变 得 越 复杂 。 

在 元 余 信 息 的 计算 方面 已 经 开展 了 大 量 的 研究 和 开发 工作 ， 称 之 为 差错 检测 码 ( Error 
Detection Code，EDC) 或 错误 校 验 码 ( Error Correction Code，ECC)。 所 有 这 些 技术 都 会 计 
算 关 于 数据 块 内 容 的 一 个 函数 ， 对 应 结果 往往 是 一 个 很 小 的 数 。 当 把 数据 写 入 磁盘 的 时 候 ， 
就 会 计算 相应 的 函数 值 ， 并 将 计算 结果 和 数据 自身 一 起 写 到 磁盘 上 。 当 从 磁盘 上 读 取 数据 的 
时 候 ， 会 再 次 计算 相应 函数 ， 并 将 计算 结果 同 当初 在 数据 写 操作 期 间 存 储 的 计算 结果 值 进行 
比较 。 如 果 这 两 个 数值 不 一 致 ， 那 么 就 说 明 读 操作 或 写 操作 可 能 发 生 了 一 个 错误 。( 读 操作 
错误 可 能 反映 了 从 相应 数据 写 人 磁盘 以 来 已 经 遭受 了 损坏 。) 

最 简单 的 差错 检测 码 包括 循环 宛 余 校 验 码 ( Cyclic Redundancy Check，CRC， 或 称 为 
循环 元 余 校 验 )， 有 时 也 称 作 纵向 宛 余 校 验 码 (Longitudinal Redundancy Check,，LRC, 或 
称 为 纵向 宛 余 校 验 )。 在 这 种 方法 里 ， 所 计算 的 函数 被 描述 为 一 个 多 项 式 。 例 如 ， 多 项 式 
和 HH+1 表示 的 就 是 二 进 制 数 10101， 此 处 的 二 进 制 数 表 示 了 多 项 式 数 值 的 指数 的 乘 数 。 我 
们 可 以 把 X+X2+1 更 确切 地 写成 : (1XX4) + (0XPB)+ (1XR)+ (0XXI)+(1XXO)。 
计算 过 程 可 以 被 认为 是 用 数据 块 中 的 数据 去 除 以 多 项 式 所 表示 的 二 进 制 数 ， 所 得 余数 就 是 循 
环 元 余 校 验 码 。 这 种 类 型 的 计算 在 计算 领域 ， 尤 其 是 在 网 络 方面 ， 有 着 广泛 的 应 用 。 因 为 网 
络 中 预计 出 现 的 错误 类 型 与 磁盘 驱动 器 预料 出 现 的 错误 类 型 有 些 不 同 ， 所 以 其 所 使 用 的 多 项 
式 往 往 也 是 不 一 样 的 。 表 14-3 中 给 出 了 几 种 常用 的 不 同类 型 的 多 项 式 。 有 些 时 候 ， 错 误 可 
能 会 发 生 在 某 一 行 的 多 个 二 进 制 数位 上 ， 这 种 情形 称 为 突 发 错误 (burst error)。 一 个 多 项 式 
编码 可 以 检测 出 任何 一 个 长 度 小 于 或 等 于 该 多 项 式 长 度 的 突 发 错误 。 关 于 这 种 类 型 的 计算 ， 
已 经 使 用 了 有 一 段 时 间 了 ， 其 主要 原因 在 于 一 套 使 用 了 移 位 寄存 器 的 简单 快捷 的 硬件 的 研发 
成 功 。 

CRC-12 用 于 6 位 字符 的 串 行 通信 线路 ， 并 会 生成 一 个 12 位 的 循环 元 余 校 验 码 。CRC- 
16 和 CRC-CCITT 均 用 于 8 位 的 串 行 通信 中 ， 并 会 生成 一 个 16 位 的 循环 元 余 校 验 码 。 后 两 
种 循环 元 余 校 验 码 在 美国 和 欧洲 分 别 得 到 了 普遍 使 用 ， 并 为 大 多 数 的 应 用 程序 提供 了 充分 的 
保护 。CRC-CCITT 用 于 磁盘 驱动 器 上 。CRC-32 会 生成 一 个 32 位 的 循环 元 余 校 验 码 。CRC- 
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32 多 项 式 用 于 IEEE-802 网 络 中 ,包括 以 太 网 、 令 牌 环 网 以 及 无 线 局 域 网 等 。 
表 14-3 几 种 常用 的 循环 宛 余 校 验 码 多 项 式 


CRC-12 .> .| 

CRC-16 | 

CRC-CCITT | 

CRC-32 GD We 


在 更 现代 的 驱动 器 中 使 用 了 更 为 复杂 的 计算 方法 ， 具 体 包括 海 明 码 和 里 德 - 所 罗 门 码 - 
与 各 种 各 样 的 循环 元 余 校 验 码 函数 相 比 ， 它 们 会 生成 更 多 的 元 余 信息 。 一 个 典型 的 驱动 右 通 
常 可 能 存储 了 12 字 节 的 元 余 代 码 附 着 在 512 字 节 的 数据 块 上 ， 而 且 能 够 校正 长 达 22 位 的 突 
发 错误 。 特 别 地 ， 里 德 - 所罗门 码 被 应 用 于 光盘 驱动 器 中 ， 于 是 ， 每 帧 中 除 存放 了 24 字 节 
的 数据 外 ， 还 存放 了 8 字 节 的 错误 校 验 码 用 于 错误 校正 的 目的 。 之 所 以 要 求 如 此 更 高 等 级 的 
宛 余 ， 是 因为 当 一 个 系统 处 于 运行 过 程 中 的 时 候 ， 驱 动 器 就 会 经 常 地 被 使 用 ， 比 如 一 个 汽车 
上 的 光盘 播放 器 ， 而 且 此 类 存储 介质 很 容易 被 损坏 。 


14.6 ”廉价 磁盘 元 余 阵列 


现代 的 硬盘 是 非常 可 靠 的 。 我 们 一般 根据 平均 故障 间隔 时 间 ( Mean Time Between 
Failures，MTBF ) 来 度量 其 可 靠 性 。 然 而 ， 我 们 可 以 通过 以 特殊 的 方式 使 用 多 个 磁盘 驱动 
器 来 进一步 提高 这 种 可 靠 性 ， 并 使 其 拥有 更 长 的 使 用 寿命 。 我 们 在 这 一 节 中 所 描述 的 技术 
称 为 廉价 磁盘 宛 余 阵列 ( Redundant Arrays of Inexpensive Disk，RAID )。 一 些 作 者 用 “ 独 
立 ”( 即 “independent”) 取代 了 “廉价 ”( 即 “inexpensive”) 这 个 词 ， 但 是 ， 后 者 才 是 在 术 
语 “RAID” 首 次 被 那些 系统 地 研究 由 多 个 磁盘 驱动 器 组 成 的 阵列 的 使 用 的 研究 人 员 提 出 时 ， 
实际 上 所 采用 的 那个 词语 。 最 初 使 用 这 个 术语 的 目的 是 要 表明 ， 通 过 以 巧妙 的 方式 把 廉价 的 
磁盘 驱动 器 组 合 到 一 起 ， 就 能 够 实现 用 较 少 的 钱 来 获得 很 贵 的 磁盘 驱动 器 才 可 拥有 的 可 靠 性 
的 目标 。 不 过 ， 如 今 即 便 是 廉价 的 磁盘 驱动 器 也 是 非常 可 靠 的 。 尽 管 如 此 ， 这 些 技术 非常 重 
要 的 一 点 就 在 于 ， 为 了 让 磁盘 驱动 器 能 够 正常 有 效 地 工作 ， 各 个 磁盘 驱动 器 的 故障 模式 必须 
是 独立 的 。 这 便 意味 着 磁盘 驱动 器 必须 运转 在 单独 的 输入 /输出 通道 和 输入 /输出 控制 器 上 ， 
从 而 获得 最 优 的 可 靠 性 和 性 能 。 如 果 不 能 做 到 这 一 点 ， 相 关 技术 仍 然 可 以 确保 数据 不 会 丢 
失 。 当 然 ， 在 替换 共享 部 件 的 时 候 ， 数 据 有 可 能 无 法 获取 到 。 

对 廉价 磁盘 元 余 阵 列 构 型 的 支持 通常 是 在 磁盘 控制 器 中 来 完成 的 。 但 是 ， 廉 价 磁盘 元 
余 阵 列 不 一 定 非得 要 有 一 个 专用 的 控制 器 。 对 于 廉价 磁盘 元 余 阵 列 的 某 些 构 型 来 说 ， 可 能 会 
通过 操作 系统 中 的 一 个 软件 模块 来 控制 廉价 磁盘 宛 余 阵 列 的 处 理 过 程 。 现 在 ， 在 大 多 数 操作 
系统 的 软件 模块 里 通常 已 提供 了 0 级 和 5 级 的 廉价 磁盘 元 余 阵 列 构 型 ( 即 RAID 0 和 RAID 
5 )。 这 些 构 型 将 会 在 14.6.1 小 节 中 展开 进一步 的 介绍 说 明 。 

最 初 的 廉价 磁盘 元 余 阵 列 规格 包括 6 种 构 型 ( 即 6 个 级 别 )， 分 别称 为 RAID 0、RAID 
1、…, 一 直到 RAID 5。 这 些 构 型 大 多 数 都 比 使 用 一 个 单独 的 磁盘 驱动 器 要 更 为 可 靠 ， 其 中 
的 一 些 构 型 还 在 某 些 方面 获得 了 性 能 的 改善 和 提高 ， 不 过 同时 在 其 他 方面 的 性 能 则 有 所 下 降 
和 变 差 。RAID 0 是 个 例外 ， 因 为 其 仅仅 提高 了 性 能 ( 译 者 注 : 原 书 作 者 声称 ，RAID 0 仅仅 
在 读 操 作 方 面 提高 了 性 能 ， 应 当 属于 笔 误 ， 因 为 其 对 读 写 操作 均 可 并 行 展 开 ， 所 以 读 写 操作 


方面 的 性 能 均 应 有 所 提高 ! )， 而 对 可 靠 性 没有 任何 改变 ， 甚 至 还 有 所 降低 。 


14.6.1 廉价 磁盘 宛 余 阵列 构 型 


下 面 即 将 给 出 的 几 幅 图 显示 了 廉价 磁盘 宛 余 阵列 的 若干 构 型 ， 且 每 一 幅 图 试图 描绘 的 存 
储 系统 都 持 有 相同 数量 的 用 户 数据 。 在 每 种 构 型 中 的 各 磁盘 驱动 器 的 容量 大 小 都 是 相同 的 ， 
并 且 我 们 展现 和 说 明了 对 于 相应 构 型 需要 多 少 个 磁盘 驱动 器 就 可 以 产生 独立 的 4 个 磁盘 驱动 
器 的 存储 容量 ( 译 者 注 : 其 实 ， 对 于 廉价 磁盘 宛 余 阵 列 来 讲 ， 数 据 信息 真正 存放 在 磁盘 或 者 
准确 地 说 是 存放 在 硬盘 上 ， 所 以 在 廉价 磁盘 宛 余 阵列 一 节 的 其 他 部 分 ， 凡 描述 “磁盘 驱动 器 " 
但 强调 其 信息 存储 的 ， 我 们 有 时 以 “磁盘 ”或 “硬盘 ”相称 )。 操 作 系统 的 高 层 部 分 将 把 每 
种 廉价 磁盘 元 余 阵 列 构 型 视 为 一 个 单独 的 磁盘 驱动 器 ， 而 其 存储 容量 则 是 组 成 廉价 磁盘 宛 余 
阵列 构 型 的 单独 一 个 磁盘 驱动 器 的 4 倍 。 廉 价 磁盘 宛 余 阵列 主要 使 用 了 三 种 技术 ， 分 别 是 磁 
盘 镜 像 (把 数据 复制 到 一 个 以 上 的 磁盘 驱动 器 上 )、 条 纹 划分 (将 一 个 文件 拆 开 和 分 别 存放 到 
一 个 以 上 的 磁盘 驱动 器 上 ) 和 错误 校正 (存储 宛 余 数据 ， 支 持 错 误 检 测 及 可 能 的 修复 )。 不 
同 的 廉价 磁盘 宛 余 阵列 构 型 往往 会 使 用 这 些 技术 中 的 一 种 或 多 种 。 

RAID 0 一 一 没有 奇偶 校 验 的 条 纹 式 磁盘 阵列 ( striped disk array)。 这 种 构 型 利用 了 数 
据 条 纹 划 分 ( data striping) 技术 ,将 每 一 个 文件 的 数据 块 分 散 存放 在 多 个 磁盘 驱动 器 中 ， 
不 过 ， 甚 没有 提供 宛 余 机 制 。 尽 管 廉价 磁盘 宛 余 阵列 技术 的 研发 人 员 使 用 了 术语 条 纹 划分 
( strip) 而 非 术 语 盘 块 (block)， 然 而 在 实践 中 ， 相 关 实现 总 是 基于 数据 块 来 处 理 和 完成 的 。 
鉴于 这 种 构 型 可 以 并 行 地 执行 多 个 读 操作 和 多 个 写 操作 ， 所 以 在 性 能 方面 有 所 改善 。 不 过 ， 
这 种 构 型 并 没有 增加 容错 能 力 (或 称 为 容错 性 )。 事 实 上 ， 这 种 构 型 降低 了 可 靠 性 ， 因 为 如 
果 一 个 磁盘 驱动 器 坏 了 ,那么 由 于 操作 系统 是 把 磁盘 驱动 器 阵列 看 作 了 一 个 单独 的 磁盘 驱动 
器 ， 所 以 磁盘 驱动 器 阵列 中 所 有 的 数据 都 会 丢失 。 如 果 有 个 磁盘 驱动 器 在 运转 ， 那 将 意 
味 着 ， 这 种 构 型 就 会 有 N 倍 的 出 现 故障 的 可 能 性 。 如 果 廉 价 磁盘 宛 余 阵 列 的 支持 是 由 磁盘 
控制 器 来 提供 的 ， 那 么 这 时 的 操作 系统 就 无 法 访问 任何 其 余 的 磁盘 驱动 器 。 而 如 果 相 应 的 支 
持 是 由 操作 系统 的 设备 驱动 软件 提供 的 ， 那么 其 余 的 磁盘 驱动 器 在 理论 上 依然 存在 被 访问 
的 可 能 性 ， 不 过 ， 任 何 一 个 文件 都 不 可 能 是 完 完整 整地 存放 在 其 余 的 磁盘 驱动 器 上 的 。 如 
图 14-5 所 示 ， 磁 盘 中 的 数字 表示 将 文件 数据 写 和 磁盘 时 的 逻辑 盘 块 号 (在 文件 系统 中 可 以 
看 到 )。 

RAID 1 一 一 磁盘 镜像 (又 称 磁盘 双 工 )。 在 RAID 1 构 型 中 ， 另 有 一 套 完 全 相同 的 磁盘 
驱动 器 ( 即 磁盘 的 副本 )。 当 往 一 块 磁盘 中 写 入 任何 数据 的 时 候 ， 该 数据 也 会 同时 被 写 人 该 
磁盘 的 副本 ( 即 磁盘 镜像 ) 中 。 如 图 14-6 所 示 ， 其 中 带 有 阴影 效果 的 那 套 磁盘 就 是 磁盘 镜 
像 。 假 设 一 块 主 盘 和 它 的 镜像 盘 可 以 同时 读 取 ， 那 么 这 种 构 型 提供 的 读 事务 的 速率 可 以 达到 
单个 磁盘 的 两 倍 。 这 种 构 型 对 写 事务 的 速率 没有 什 


么 效果 ， 因 为 每 一 数据 块 均 须 同时 被 写 到 主 盘 和 镜 KE FED RD Cp 
像 盘 中 、 所 以 并 行 的 效果 也 就 家 失掉 了 。 但 如 果 有 | a me wl 
一 个 磁盘 驱动 器 出 现 了 故障 ， 相 关 数 据 还 将 是 很 安 tl I EE 9 
全 的 ， 不过， 这 时 性 能 会 有 所 下 降 ， 因 为 在 访问 相 | 
应 磁盘 及 其 镜像 盘 的 时 候 ， 二 者 只 能 有 一 个 磁盘 驱 [| | | | 
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动 器 可 用 来 对 访问 请 求 提 供 服务 。 这 是 代价 最 高 的 
一 种 廉价 磁盘 元 余 阵 列 构 型 。 图 14-5 ” RAID 0 一 一 条 纹 式 磁盘 阵列 
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图 14-6 RAID 1 一 一 磁盘 镜像 





RAID 2 一 一 纠 错 编 码 ( error-correcting coding) 和 RAID 3 位 交叉 奇偶 校 验 (bit- 
interleaved parity)。 这 两 种 技术 已 被 证 明 是 代价 高 得 惊人 而 且 效 果 还 不 如 其 他 技术 ， 它 们 还 
要 求 磁盘 旋转 须 保持 同步 以 获取 高 性 能 。 如 今 ， 它们 已 不 再 使 用 了 。 为 此 ， 在 这 里 我 们 就 不 
对 它们 展开 详细 描述 了 。 

RAID 4 一 一 奇偶 校 验 专用 磁盘 ( dedicated parity drive)。 这 种 构 型 提供 了 数据 块 级 别 的 
条 纹 划 分 (就 像 RAID 0 ) 并 设立 有 奇偶 校 验 磁盘 。 其 中 ,被 写 到 奇偶 校 验 专用 磁盘 的 所 谓 
奇偶 校 验 块 用 来 校 验 其 所 在 条 纹 的 其 他 的 数据 块 ， 在 这 个 例子 中 ， 如 “奇偶 校 验 块 1 一 4” 
应 涵盖 数据 块 1、2、3、4， 以 此 类 推 ， 如 图 14-7 所 示 。 如 果 有 一 个 数据 磁盘 出 现 了 故障 ， 
那么 相应 的 奇偶 校 验 数据 就 会 被 用 来 创建 一 个 替代 磁盘 。RAID 4 的 一 个 劣势 在 于 ， 每 写 一 
个 数据 块 ， 就 必须 同时 对 相应 的 奇偶 校 验 块 进 行 读 取 、 重 新 计算 和 重 写 操作 。 为 此 ， 奇 偶 校 
验 磁 盘 就 成 为 一 个 输入 /输出 瓶颈 。 这 种 构 型 提供 了 与 RAID 1 几乎 同样 的 可 靠 性 ， 但 如 果 
有 一 个 磁盘 驱动 器 坏 了 ， 对 性 能 的 冲击 将 是 非常 严重 的 。 尽 管 如 此 ， 其 代价 只 是 唯一 额外 的 
磁盘 驱动 器 ， 因 此 ， 如 果 廉 价 磁 盘 宛 余 阵 列 拥 有 多 个 磁盘 驱动 器 ， 这 种 构 型 在 价格 方面 还 是 
非常 有 优势 的 。 











图 14-7 RAID4 





奇偶 校 验 专用 磁盘 


RAID 5 一 一 块 交叉 分 布 式 奇 偶 校 验 (block interleaved distributed parity)。RAID 5 与 
RAID 4 非常 相似 , 但 是 ，RAID 5 并 没有 把 奇偶 校 验 块 全 部 放 到 同一 块 磁盘 上 ， 而 是 以 轮转 
方式 把 奇偶 校 验 块 分 配 和 分 散 存 放 到 各 块 磁盘 上 ， 如 图 14-8 所 示 。 这 项 技术 消除 了 我 们 在 
RAID 4 中 所 看 到 的 过 度 使 用 奇偶 校 验 盘 的 问题 。RAID 5 是 最 受 欢 迎 的 廉价 磁盘 元 余 阵 列 构 
型 之 一 。 

下 面 的 廉价 磁盘 宛 余 阵 列 构 型 并 非 最 初 的 廉价 磁盘 元 余 阵 列 规格 的 组 成 部 分 ， 但 是 它们 
已 被 广泛 地 接受 了 ， 并 且 通 常 被 视 为 标准 。 
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图 14-8 RAID 5 一 一 块 交 又 分 布 式 奇偶 校 验 


RAID 6 一 一 独立 的 双 奇 偶 校 验 数据 磁盘 (independent data disk with double parity)。 本 
构 型 中 ， 提 供 了 RAID 5 中 的 数据 块 级 别 的 条 纹 划 分 和 奇偶 校 验 数 据 跨 多 磁盘 的 分 布 式 存 
放 。 但 是 ， 其 并 没有 仅仅 采用 一 套 简单 的 奇偶 校 验方 案 ， 而 是 同时 利用 两 种 不 同 的 算法 来 计 
算 奇偶 校 验 值 。 在 实现 RAID 6 构 型 的 过 程 中 ,使 用 了 包括 双重 编码 校 验 (具体 为 奇偶 校 验 码 
和 里 德 - 所罗门 码 )、 正 交 双 奇偶 校 验 、 对 角 双 奇偶 校 验 等 在 内 的 多 种 计算 方法 。 如 图 14-9 
所 示 ， 其 中 ， 对 于 两 种 不 同 的 奇偶 校 验 块 ， 分 别 在 相应 条 纹 中 标 以 函数 P 和子 数 Q 来 加 以 
区 分 ， 同 时 还 分 别 配 上 了 对 比 鲜明 的 阴影 。 同 RAID 5 相 比 ，RAID 6 需要 多 增加 一 个 磁盘 
驱动 器 ， 但 其 将 可 以 承受 同时 损坏 两 个 磁盘 驱动 器 的 故障 情况 。 
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图 14-9 ”RAID 6 一 一 独立 的 双 奇 偶 校 验 数据 磁盘 


RAID 0+1 一 一 条 纹 式 单 镜像 ( mirror of stripes)。 在 这 种 构 型 中 ， 将 创建 两 套 RAID 0 数 
据 条 纹 〈 即 数据 块 )， 并 通过 一 套 RAID 1 镜像 机 制 来 具体 实施 ， 如 图 14-10 所 示 。 其 中 ,条 纹 划 
分 技术 改进 了 性 能 ， 而 镜像 技术 则 增强 了 可 靠 性 。 一 般 来 说 ， 这 种 构 型 表现 要 优 于 RAID 5。 

RAID 1+0 (又 称 RAID 10 ) 条 纹 式 多 镜像 ( stripes of mirrors)。 设 立 多 套 RAID 1 
镜像 机 制 ( 即 所谓 的 磁盘 驱动 器 镜像 对 ,或 简称 镜像 对 )， 同 时 支持 RAID 0 条 纹 划分 ， 
如 图 14-11 所 示 。 这 种 构 型 与 RAID 0+1 有 着 相似 的 性 能 和 可 靠 性 特征 。 但 是 ， 当 一 个 磁盘 
驱动 器 发 生 故 障 的 时 候 ， 其 性 能 和 可 靠 性 会 稍 好 一 些 。 具 体 而 言 ， 对 于 RAID 0+1 构 型 而 
言 ， 一 个 磁盘 驱动 器 的 损坏 意味 着 相应 整个 数据 条 纹 集 的 丢失 ， 所 以 另外 的 一 个 数据 条 纹 集 
必须 承担 所 有 的 数据 存 取 工 作 。 而 对 于 RAID 1+0 构 型 来 说 ， 只 有 对 应 损坏 了 磁盘 驱动 器 的 
镜像 对 的 另 一 个 磁盘 驱动 器 才 须 承担 相应 镜像 对 的 所 有 数据 存 取 工作 ， 而 其 他 镜像 对 可 以 像 
以 往 一 样 正常 、 高 效 、 可 靠 地 工作 。 


14.6.2 ”廉价 磁盘 元 余 阵 列 故障 


在 建立 RAID 0+1 构 型 时 ， 我 们 可 以 使 用 两 个 控制 器 来 创建 数据 条 纹 集 ， 同 时 使 用 设备 
驱动 程序 级 别 的 软件 来 实现 数据 条 纹 集 的 镜像 。 就 像 前 面 所 描述 的 那样 ， 在 这 种 情况 下 ， 单 
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图 14-10 ”RAID 0+1 一 一 条 纹 式 单 镜像 图 14-11 RAID 1+0 一 一 条 纹 式 多 镜像 


个 磁盘 驱动 器 的 故障 会 导致 整个 数据 条 纹 集 的 丢失 。 但 是 ， 如 果 运 行 在 RAID 0+1 构 型 的 控 
制 器 了 解 整个 构 型 配置 ， 那 么 当 璧 如 说 3 号 磁盘 驱动 器 发 生 故 障 时 ， 其 将 会 继续 对 文件 进行 
数据 条 纹 划 分 并 分 别 存储 到 数据 条 纹 集 A 的 其 他 4 个 磁盘 驱动 器 上 。 而 如 果 后 来 6 号 磁盘 
驱动 器 也 发 生 了 故障 ， 其 还 可 以 使 用 2 号 磁盘 驱动 器 作为 替代 进行 处 理 ， 因 为 此 二 者 应 当 拥 
有 相同 的 数据 。 所 以 ， 从 理论 上 来 讲 ， 这 样 会 使 RAID 0+1 能 够 提供 像 RAID 1+0 那样 的 容 
错 性 。 然 而 ， 遗 憾 的 是 ， 大 多 数控 制 器 并 不 是 这 样 设计 的 。 

当 出 现 故障 的 磁盘 驱动 器 被 蔡 换 掉 的 时 候 ， 系 统 将 必须 重建 存储 在 故障 磁盘 驱动 器 ( 译 
者 注 : 实际 上 是 其 中 的 磁盘 ) 上 的 信息 。 在 RAID 0+1 构 型 中 ， 如 果 2 号 磁盘 驱动 器 发 生 了 
故障 ， 那么 5 个 硬盘 上 的 数据 将 需要 被 重建 ， 因 为 整个 “数据 条 纹 集 A” 都 将 被 消除 掉 。 而 
在 RAID 1+0 构 型 中 ， 只 有 2 号 磁盘 驱动 器 ( 译 者 注 : 即 其 硬盘 上 的 数据 ) 必须 重建 。 在 这 
里 再 一 次 强调 ，RAID 1+0 具有 更 大 的 优势 。 

还 有 好 多 其 他 的 有 专利 权 的 廉价 磁盘 元 余 阵 列 构 型 ， 包 括 许多 商标 性 的 术语 。 这 些 构 
型 在 某 种 特定 的 情况 下 可 能 有 某 些 好 处 ， 也 可 能 没有 某 些 好 处 。 对 测试 构 型 的 分 析 ， 尤 其 是 
对 它们 在 各 种 故障 情景 中 的 表现 的 分 析 ， 并 不 是 一 件 小 事 ， 但 在 特殊 的 情况 下 可 能 是 担保 性 
质 的 。 

在 比 RAID 0 更 高 级 的 RAID 构 型 中 ， 当 有 一 块 硬盘 出 现 故 障 的 时 候 ， 整 个 阵列 可 以 继 
续 运 行 ， 只 是 有 时 性 能 会 比较 低 ， 而 有 时 我 们 会 面临 发 生 更 多 故障 的 风险 。 例 如 ， 在 RAID 
1 构 型 中 的 一 块 硬盘 的 损坏 通常 意味 着 ， 此 刻 我 们 将 会 面临 某 种 增加 的 风险 ， 因 为 一 旦 相应 
镜像 对 中 的 另 一 块 硬盘 也 出 现 故障 ， 我 们 就 会 丢失 该 镜像 对 上 的 所 有 的 数据 信息 。 为 此 ,在 
只 有 一 块 硬盘 出 现 故 障 的 情况 下 ， 我 们 可 以 继续 保持 廉价 磁盘 宛 余 阵 列 的 运行 。 这 时 候 ， 我 
们 会 注意 到 在 执行 某 些 读 操作 的 过 程 中 性 能 有 些 下 降 ， 这 是 因为 我 们 现在 只 有 一 块 硬盘 来 完 
成 这 些 读 操作 ， 而 在 那 块 硬盘 损坏 之 前 ， 我 们 是 有 两 块 硬盘 来 共同 协作 和 共同 承担 完成 相应 
的 读 操作 任务 的 。 在 其 他 的 某 些 场景 中 ， 我 们 也 可 能 会 因为 系统 的 性 能 变 得 无 法 接受 而 不 得 
不 关闭 系统 。 例 如 ,在 RAID 6 构 型 中 ， 如 果 我 们 坏 了 一 块 硬 盘 ， 写 操作 的 性 能 将 会 变 得 非 
常 糟糕 ， 因 为 我 们 必须 要 读 取 所 有 其 他 的 硬盘 ， 才 能 够 计算 出 故障 硬盘 的 奇偶 值 ， 这 已 经 到 
了 能 被 接受 的 边缘 线 上 。 然 而 ， 只 要 坏 掉 的 那 块 硬盘 被 替换 之 后 ， 我 们 就 可 以 开启 重建 存储 
在 故障 硬盘 上 的 信息 了 。 
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这 样 便 提出 了 一 个 问题 ， 那 就 是 对 于 廉价 磁盘 元 余 阵 列 构 型 来 说 ， 我 们 希望 使 用 那 种 可 
以 “ 热 插 拔 ”的 硬盘 。 这 意味 着 ， 在 无 须 关 掉 系 统 电 源 的 前 提 条 件 下 ， 就 可 以 拔 下 出 现 故 障 
的 那 块 硬盘 ， 同 时 把 一 块 新 的 硬盘 插 上 去 。 尽 管 这 种 技术 很 容易 理解 ， 但 是 它 确 确实 实 需 要 
特殊 的 硬件 ， 且 相关 硬件 要 比 普通 硬盘 贵 出 许多 。 这 项 决定 可 能 要 取决 于 保持 系统 运行 对 于 
某 些 操 作 来 说 是 否 至 关 重 要 或 者 是 否 只 有 数据 存在 才 是 至 关 重 要 的 。 如 果 是 后 一 种 情况 ,我 
们 可 能 会 倾向 于 采取 系统 停机 处 理 措施 而 不 是 为 相应 磁盘 驱动 器 多 付 价 钱 。 

而 有 些 情 况 下 ， 保 持 系统 运行 是 必需 的 要 求 。 例 如 ， 对 于 医院 的 系统 来 讲 ， 其 对 病人 
的 护理 可 能 是 非常 关键 的 ， 系 统 故障 可 能 就 意味 着 生命 的 消逝 。 对 于 这 样 的 案例 ， 我 们 可 能 
会 选择 更 进一步 的 应 急 预 案 ， 即 在 架子 上 配备 一 个 空置 的 磁盘 驱动 器 时 刻 准 备 着 ,一 旦 发 生 
某 个 磁盘 驱动 器 出 现 故障 的 情况 就 立刻 将 其 插 到 系统 上 。 在 极端 情况 下 ， 我 们 可 能 会 让 一 
个 磁盘 驱动 器 处 于 暖 备 份 ( warm standby) 状态 这 个 磁盘 驱动 器 已 经 插入 磁盘 驱动 器 架 
上 ， 只 是 尚未 加 电 ， 或 只 是 没有 旋转 。 当 操作 系统 检测 到 发 生 故 障 的 时 候 ， 就 会 为 该 热 备 份 
磁盘 驱动 器 加 电 和 使 其 旋转 起 来 ， 并 开启 相应 数据 重建 过 程 。 当 然 ， 磁 盘 镜像 是 热 备 份 (hot 
standby) 的 极端 形式 。 


14.7 磁盘 操作 调度 


我 们 在 前 面 曾经 提 到 过 ， 就 系统 性 能 而 言 ， 寻 道 时 间 是 磁盘 驱动 器 的 最 重要 的 度量 指 
标 之 一 。 已 经 证 实 ， 如 果 我 们 有 大 量 的 磁盘 操作 要 完成 ， 那 么 我 们 处 理 相关 请 求 的 次 序 会 对 
系统 的 整体 性 能 产生 重大 的 影响 。 在 过 去 至 少 20 多 年 的 时 间 里 ， 处 理 器 的 性 能 大 约 以 每 年 
50% 的 速率 一 直 在 稳步 提升 。 与 此 同时 ， 磁 盘 驱 动 器 性 能 的 提升 速率 仅 为 每 年 10% 左右 。 
为 此 ， 如 果 我 们 可 以 通过 牺牲 处 理 器 的 一 些 速率 来 改善 磁盘 系统 的 性 能 ， 应 当 是 合乎 情理 
的 。 为 了 说 明 这 个 道理 ， 让 我 们 来 假设 ， 我 们 现在 有 需要 服务 的 一 系列 的 磁盘 请 求 ， 同 时 ， 
磁盘 驱动 器 的 一 个 寻 道 操作 将 会 把 所 有 的 磁头 一 起 移动 到 某 个 磁道 或 柱 面 上 。 因 此 ， 我 们 将 
只 需 考 虑 磁道 号 ， 并 应 认识 到 我 们 实际 上 在 同时 定位 〈 可 能 ) 许多 磁头 一 一 当然 ， 至 少 两 个 。 
所 以 ， 我 们 将 会 把 那些 由 系统 中 运行 的 诸多 进程 提出 而 到 达 输 入 /输出 系统 的 磁道 号 列 成 一 
个 表 ， 进 而 查看 执行 相关 请 求 所 必需 的 寻 道 时 间 ， 然 后 来 确认 我 们 是 否 可 以 就 此 有 所 改进 。 
在 所 有 这 些 情景 中 ,我 们 均 假设 磁盘 驱动 器 拥有 80 个 磁道 ， 磁 头目 前 停留 在 28 号 磁道 上 ， 
而 且 我 们 面临 如 下 以 队列 方式 表示 的 一 组 请 求 : 

17, 30, 24, 37, 15, 27, 11, 75, 20, 5 


14.7.1 先 来 先 服务 调度 算法 


处 理 这 些 请 求 的 最 简单 的 方法 就 是 按照 它们 在 队列 中 的 先后 顺序 来 依次 为 它们 提供 服 
务 ， 称 之 为 先进 先 出 ( First In First Out，FIFO) 调度 算法 ， 又 常 称 为 先 来 先 服务 (First Come 
First Served，FCFS) 调度 算法 。 这 种 算法 吸引 人 的 地 方 在 于 其 实现 起 来 非常 简单 ， 同 时 还 
有 一 个 优点 就 是 ， 它 是 公平 的 。 其 公平 性 具体 体现 为 ， 首 先 提出 请 求 的 进程 首先 获得 服务 。 
不 过 ， 这 种 算法 不 一 定 能 够 获得 最 好 的 系统 总 体 性 能 。 此 外 ， 我 们 以 后 将 会 看 到 ， 甚 至 对 于 
单独 的 一 个 应 用 程序 而 言 ， 这 种 算法 也 可 能 不 会 达到 最 佳 的 性 能 。 在 实施 先 来 先 服务 调度 算 
法 的 过 程 中 ， 操 作 系统 将 会 按照 各 请 求 在 队列 中 的 先后 顺序 在 磁道 间 移 动 磁头 。 因 此 ， 磁 头 
首先 会 从 28 号 磁道 移动 到 17 号 磁道 ， 然 后 移动 到 30 号 磁道 ， 接 着 再 移动 到 24 号 磁道 ， 依 
次 类 推 。 按 照 这 种 顺序 处 理 该 请 求 队列 时 ， 系 统 寻 道 将 总 共 会 移动 磁头 跨越 227 个 磁道 ， 如 
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图 14-12 所 示 。 因 为 我 们 不 太 清楚 期 间 所 涉及 的 旋转 延迟 时 间 ， 所 以 我 们 将 使 用 系统 为 了 服务 
那些 请 求 而 寻 道 时 需要 移动 磁头 跨越 的 磁道 数 ， 作 为 我 们 衡量 相关 算法 是 否 高 效 的 度量 标准 。 


先 来 先 服务 调度 算法 





| 
图 14-12” 先 来 先 服务 调度 算法 


14.7.2 ”搭便 车 调度 算法 


搭便 车 ( pickup) 调度 算法 是 被 某 些 专 家 推崇 和 提起 的 关于 先 来 先 服 务 调度 算法 的 一 种 
变种 算法 。 在 这 种 算法 里 ， 服 务 请 求 通常 采取 与 先 来 先 服务 调度 算法 相同 的 排序 方法 ,但 是 
在 系统 移动 磁头 的 过 程 中 ， 它 将 会 在 即将 经 过 的 有 操作 请 求 在 队列 中 的 任何 一 个 磁道 处 停留 
下 来 并 给 予 相 应 的 操作 服务 。( 相 应 调度 实现 模块 在 Linux 系统 中 称 为 Noop 调度 器 ， 这 里 
Noop 即 No Operation。) 例如 ， 对 于 我 们 的 例子 所 给 出 的 请 求 队列 ， 磁 头 一 开始 是 在 28 号 
磁道 上 ， 然 后 开始 向 队列 中 的 第 一 个 请 求 ， 即 17 号 磁道 移动 。 但 在 移动 行进 途中 ， 其 将 会 
把 27 号 、24 号 以 及 20 号 磁道 的 请 求 捡 拾 起 来 先行 予以 服务 处 理 。 为 此 ， 实 际 调度 服务 所 
对 应 的 整个 序列 应 当 是 : 

27,24,20.17,3037#15, 11; 75;5 


上 述 调度 过 程 最 终 导 致 的 总 的 寻 道 时 间 即 移动 磁头 所 跨越 的 磁道 数 为 191 个 ， 相 对 于 先 
来 先 服务 调度 算法 而 言 有 了 相当 大 的 改进 。 图 14-13 具体 说 明了 针对 该 示例 的 基于 搭便 车 调 
度 算法 的 调度 过 程 。 


搭便 车 调度 算法 





1 2 3 4 5 6 8 9 10 11 
14-13 ”搭便 车 调度 算法 


、14.7.3 ”最 短 寻 道 时 间 优 先 调度 算法 


接 下 来 ,我们 来 看 一 下 一 种 所 谓 的 最 短 寻 道 时 间 优 先 ( Shortest Seek Time First，SSTF ) 
调度 算法 ， 有 时 也 称 为 最 短 定 位 时 间 优 先 (Shortest Positioning Time First, SPTF ) 调度 算法 。 


二 


当 我 们 在 操作 系统 的 其 他 地 方 (如 虚拟 内 存 页 面 置换 或 进程 调度 ) 使 用 类 似 算法 的 时 候 ， 我 
们 经 常会 说 ,诚然 它们 是 最 佳 的 算法 ,但 是 我 们 却 不 能 真正 地 利用 它们 ， 因 为 我 们 无 法 预知 
未 来 。 然 而 ， 对 于 磁盘 调度 来 讲 ， 我 们 是 可 以 真正 利用 这 种 算法 的 ， 因 为 我 们 所 关注 的 所 有 
请 求 都 在 我 们 所 查看 的 队列 中 。 再 次 地 ， 一 开始 我 们 把 磁头 放 在 28 号 磁道 上 ， 在 队列 中 离 
28 号 磁道 最 近 的 请 求 项 是 27 号 磁道 ， 于 是 我 们 接 下 来 把 磁头 移动 到 那个 磁道 。 为 此 ， 现 在 
的 下 一 个 最 近 的 请 求 项 需要 返回 到 30 号 磁道 ， 所 以 我 们 进一步 把 磁头 移动 到 那里 。 整 个 过 
程 如 图 14-14 所 示 ， 相 应 调度 服务 所 对 应 的 整个 序列 是 : 
28, 27; 30; 24; 20, 37, 17, 1S; 1 和 .75 


其 间 ， 移 动 磁头 所 跨越 的 磁道 总 数 为 133 个 。 因 此 ， 这 种 算法 的 性 能 几乎 是 先 来 先 服务 
调度 算法 的 两 倍 。 尽 管 如 此 ， 这 种 算法 却 是 非常 不 公平 的 。 队 列 中 的 第 一 个 请 求 ， 竟 然 是 其 
中 等 待 时 间 最 长 的 ， 直 到 队列 中 大 约 一 半 的 请 求 都 被 调度 过 了 ， 它 才 得 到 了 服务 。 同 时 还 要 
注意 ， 磁 头 一 直 在 磁盘 的 中 间 部 分 来 来 回回 地 移动 ， 故 而 要 访问 位 于 磁盘 中 间 磁 道上 的 数据 
块 的 进程 ， 往 往 会 比 要 访问 位 于 磁盘 中 心 磁道 或 边缘 磁道 的 数据 块 的 进程 能 够 得 到 更 好 的 服 
务 。 另 外 请 注意 ， 在 这 种 算法 运行 的 同时 ， 操 作 系 统 可 能 会 产生 新 的 更 多 的 磁盘 操作 请 求 ， 
并 会 和 剩余 未 处 理 的 请 求 一 起 按照 最 短 时 间 优 先 调度 的 次 序 放置 在 队列 中 。 因 为 要 访问 磁盘 
中 间 磁 道 的 那些 进程 会 受到 更 多 的 青睐 和 关照 ， 所 以 它们 也 会 有 更 多 的 机 会 冲 到 队列 靠 前 位 
置 插入 另外 的 请 求 ， 从 而 进一步 扩大 了 它们 的 优势 。 这 种 算法 可 以 被 视 为 是 对 某 些 请 求 赋予 
更 高 的 优先 权 一 一 尤其 是 最 靠近 磁头 当前 位 置 的 那些 请 求 。 与 任何 优先 级 机 制 一 样 ， 我 们 必 
须要 关注 那些 较 低 优先 级 请 求 的 饥饿 现象 。 鉴 于 此 ， 可 以 采取 某 种 措施 ， 使 远离 磁头 当前 位 
置 的 那些 数据 块 的 访问 请 求 的 优先 权 逐 步 得 到 提升 ， 从 而 使 它们 尽快 得 到 相应 的 服务 。 有 
时 把 最 短 寻 道 时 间 优 先 调度 算法 的 这 种 变种 算法 称 为 请 求 时 变 式 最 短 寻 道 时 间 优 先 ( Aged 
Shortest Seek Time First，ASSTF ) 调度 算法 。 这 种 算法 主要 需要 调整 实际 的 “ 寻 道 时 间 ”( 译 
者 注 : 具体 表征 为 从 磁头 当前 所 在 磁道 到 达 目 标 磁道 所 需 跨越 的 磁道 数 )， 即 将 其 减 去 “一 
个 加 权 因 子 和 相应 请 求 在 队列 中 的 等 待 时 间 的 乘积 ”。 如 果 设 Tar 表示 一 个 请 求 的 有 效 的 (或 
加 权 的 ) 寻 道 时 间 ，7e 表示 寻 道 所 需 的 实际 时 间 ， 丈 表示 我 们 想 分 配给 过 往 请 求 的 一 个 加 权 
因子 ，Twsa 表示 相应 请 求 在 队列 中 的 等 竺 时间， 那么 请 求 时 变 式 最 短 寻 道 时 间 的 计算 公式 将 是 : 

ee A 


最 短 寻 道 时 间 优 先 调度 算法 








,Te a 交 和 和 站 Te 
图 14-14 最短 寻 道 时 间 优 先 调度 算法 


14.7.4 ”向 前 看 调度 算法 


我 们 即将 要 学 习 的 下 一 种 算法 通常 称 为 向 前 看 ( LOOK) 调度 算法 ， 它 还 有 一 个 很 流行 
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的 名 字 ， 即 电梯 调度 算法 ( elevator algorithm)。 在 该 算法 中 ,一 旦 操作 系统 按照 某 一 个 方向 
开始 移动 磁头 和 查找 磁道 ， 将 一 直 沿 着 该 方向 向 前 推移 ， 且 直到 在 该 方向 上 没有 其 他 要 访问 
的 磁道 时 ， 才 会 逆转 过 来 在 反方 向 上 开始 查找 。 换 句 话 说 ， 系 统 会 一 直 向 前 “搜寻 和 查看 ”， 
以 决定 什么 时 候 逆转 寻 道 方向 。 这 类 似 于 电梯 的 工作 方式 。 一 旦 电梯 开始 上 升 ， 它 就 会 只 
朝向 上 这 个 方向 移动 ， 直 到 它 在 这 个 方向 上 没有 请 求 为 止 ， 然 后 它 才 会 逆转 过 来 下 行 移动 。 
(就 像 许多 类 比 一 样 ， 这 种 算法 同 真正 的 电梯 工作 相 比 还 是 会 有 点 不 一 样 的 地 方 。 因 为 电梯 
还 会 考虑 来 自 某 一 层 的 请 求 是 上 行 还 是 下 行 ， 而 且 如 果 它 正在 下 降 ， 它 是 不 会 为 想 要 上 升 的 
用 户 停 下 来 的 。 但 是 操作 系统 只 需要 把 磁头 定位 到 磁道 即 可 ， 寻 道 请 求 并 没有 包含 寻 道 方向 
的 概念 。) 让 我 们 再 次 来 看 看 我 们 的 磁道 访问 请 求 序 列 ， 我 们 同时 还 假设 操作 系统 按照 磁道 
号 减 小 的 方向 开始 移动 磁头 和 查找 磁道 。 在 这 种 情况 下 ， 磁 道 请 求 调 度 服务 的 顺序 将 会 是 : 


28, 27, 24, 20, 17, 15, 11, 5, 30, 37, 75 
移动 磁头 所 跨越 的 磁道 总 数 为 93 个 ， 如 图 14-15 所 示 。 
向 前 看 调度 算法 〈 磁 头 当前 正 朝 磁 道 号 减 小 方向 移动 查找 ) 





i Da ed i BG he gD i 
图 14-15 ”向 前 看 调度 算法 (磁头 当前 正 朝 磁道 号 减 小 方向 移动 查找 ) 


而 如 果 操作 系统 按照 磁道 号 增 大 的 方向 开始 移动 磁头 和 查找 磁道 ， 那 么 磁道 请 求 调度 服 
务 的 序列 将 会 是 : 

28, 30, 37, 75, 27, 24, 20, 17; 15, 11, 5 

移动 磁头 所 跨越 的 磁道 总 数 为 117 个 ， 如 图 14-16 所 示 。 无论 哪 一 种 情形 ， 向 前 看 调度 
算法 都 比 先 来 先 服务 调度 算法 或 最 短 寻 道 时间 优 先 调度 算法 要 好 。 然 而 ， 每 次 无 论 磁头 移 向 
哪 一 端 ， 其 来 来 回回 都 会 经 过 磁盘 中 间 的 磁道 ， 也 就 是 说 ， 这 种 算法 还 是 倾向 于 关照 磁盘 中 
间 磁 道上 的 数据 块 。 因 此 ， 它 不 如 先 来 先 服 务 调度 算法 公平 ,但 是 也 不 像 最 短 寻 道 时间 优 先 
调度 算法 那样 极度 地 不 公平 。 
向 前 看 调度 算法 ( 磁头 当前 正 朝 磁道 号 增 大 方向 移动 查找 ) 





i 
图 14-16 ”向 前 看 调度 算法 (磁头 当前 正 朝 磁道 号 增 大 方向 移动 查找 ) 
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一 些 专 家 还 讨论 过 一 种 男 外 的 算法 称 为 扫描 算法 (SCAN)。 这 种 算法 和 向 前 看 调度 算法 
是 类 似 的 ， 但 是 当 队 列 中 没有 在 磁头 当前 行进 方向 上 的 磁道 访问 请 求 时 ， 该 算法 并 不 会 改变 
磁头 的 移动 方向 ， 而 是 沿 着 当前 行进 方向 继续 移动 直到 走 完全 程 到 达 磁 盘 的 另 一 端 。 因 为 没 
有 人 愿意 真正 去 实现 这 种 算法 ， 所 以 我 们 略 过 这 种 算法 。 这 里 之 所 以 会 提 到 这 种 算法 也 只 是 
出 于 完备 性 的 考量 ， 因 为 一 些 其 他 算法 的 名 称 与 “扫描 ”有 一 定 的 相关 性 。 


14.7.5 ”循环 向 前 看 调度 算法 

为 了 构造 一 种 更 公平 的 算法 ， 就 在 向 前 看 调度 算法 的 基础 上 设计 了 一 种 变种 算法 。 当 磁 
头 移动 到 某 一 方向 的 最 后 一 条 磁道 时 ， 其 将 不 再 逆转 方向 和 查找 最 近 的 磁道 ， 而 是 在 送 转 方 
向 后 由 操作 系统 控制 去 查找 队列 中 在 相反 方向 上 最 远 的 磁道 访问 请 求 。 然 后 再 回 过 头 来 ， 按 
照 之 前 查找 磁道 的 方向 开始 执行 寻 道 操作 。 其 目的 是 要 消除 给 予 磁 盘 中 间 磁 道上 的 文件 的 不 
公平 的 优越 地 位 ， 因 为 在 其 中 一 遍 穿 越 磁 盘 中 间 的 过 程 中 ， 并 未 对 任何 磁盘 操作 请 求 提 供 服 
务 。 这 种 算法 称 为 循环 向 前 看 ( Circular-LOOK，C-LOOK) 调度 算法 ， 有 些 专家 也 称 之 为 加 
简 状 向 前 看 ( cylindrical-LOOK) 调度 算法 或 循环 电梯 ( cyclic elevator) 调度 算法 。 该 算法 
名 称 所 基于 的 想法 是 ， 把 磁盘 的 地 址 空间 ( 即 磁道 号 ) 缠绕 在 一 个 圆柱 体 上 ， 于 是 查找 完 0 
号 磁道 后 ， 下 一 个 要 考虑 查找 的 磁道 就 是 80 号 磁道 ( 译 者 注 : 此 处 实际 上 潜在 假设 了 磁头 
查找 方向 为 磁道 号 减 小 的 方向 。 另 外 , 在 14.7 节 开 始 时 曾 提 到 本 节 示 例假 设 磁 盘 拥 有 80 个 
人 磁道， 故而 磁道 号 变化 范围 应 为 0 一 79， 因 此 ， 准 确 地 来 说 ， 此 处 的 80 号 磁道 应 为 79 号 磁 
道 )。 遗 憾 的 是 ， 这 种 算法 将 导致 在 磁盘 调度 服务 的 中 间 过 程 会 花费 很 长 的 寻 道 时 间 ( 译 者 
注 : 指 磁头 沿 查找 方向 到 达 尽 头 时 逆转 折返 回来 时 的 开销 )。 不 过 ,这 个 漫长 的 寻 道 过 程 也 
不 会 像 它 看 上 去 那么 糟糕 。 一 般 来 说 ， 当 我 们 讨论 磁盘 驱动 器 的 寻 道 性 能 时 ， 我 们 会 引用 平 
均 寻 道 时 间 。 然 而 ， 寻 道 时 间 并 不 会 随 着 寻 道 距离 而 线性 地 增加 。 就 像 一 个 移动 的 物体 ， 磁 
盘 上 持 有 磁头 的 磁 臂 往往 是 缓慢 地 开启 移动 ， 然 后 逐渐 会 变 得 越 来 越 快 。 因 此 ， 鉴 越 整个 磁 
盘 的 寻 道 所 花费 的 时 间 不 会 是 平均 寻 道 距离 所 花费 时 间 的 两 倍 ， 而 是 会 比 此 要 稍微 快 点 。 鉴 
于 不 可 能 对 此 做 出 准确 的 预测 ， 所 以 我 们 将 不 予 理 皮 这 些 ， 而 只 是 简单 地 进行 与 之 前 我 们 所 
做 的 相同 的 计算 ,保证 情况 不 会 真 的 有 这 么 差 就 行 了 。 再 次 说 明 ， 确 切 的 磁道 跨越 总 数 将 会 
取决 于 我 们 开始 移动 的 方向 是 磁道 号 减 小 还 是 磁道 号 变 大 的 方向 。 由 于 在 调度 服务 序列 中 部 
的 磁道 访问 请 求 的 较 大 的 寻 道 时 间 开 销 ， 磁 头 移动 的 这 两 个 方向 给 循环 向 前 看 调度 算法 所 带 
来 的 不 同 ， 不 会 像 它 们 对 向 前 看 调度 算法 曾经 显现 出 来 的 区 别 那么 厉害 。 如 图 14-17 所 示 ， 
当 沿 着 磁道 号 减 小 方向 进行 磁道 查找 时 ， 相 应 的 磁道 访问 调度 服务 序列 为 : 

28,.27, 24. 20, 47 13 41.3, 73,37,.30 

磁头 总 共 移 动 跨越 了 138 个 磁道 。 而 在 图 14-18 中 ， 我 们 可 以 看 到 ， 当 沿 着 磁道 号 增 大 
方向 进行 磁道 查找 时 ， 相 应 的 磁道 访问 调度 服务 序列 为 : 

28: 30, 37. 75. 5 20 24,27 


磁头 总 共 移动 跨越 了 139 个 磁道 。 循 环 向 前 看 调度 算法 的 诱 人 之 处 在 于 ;其 提供 了 较 低 
的 服务 可 变性 ( service variability ) 任何 给 定 的 磁盘 请 求 的 性 能 通常 都 具有 更 好 的 可 预 
测 性 ， 并 且 更 少 地 依赖 于 文件 在 磁盘 上 的 位 置 。 只 有 当 磁 盘 访 问 达 到 非常 高 的 负载 级 别 时 ， 
循环 向 前 看 调度 算法 才 会 因为 能 够 减轻 饥饿 问题 而 比 向 前 看 调度 算法 更 有 优势 。 就 像 前 面 所 
提 到 的 扫描 算法 ， 一 些 作 者 也 曾经 讨论 过 循环 扫描 算法 〈C-SCAN)， 该 算法 在 逆转 磁头 移动 





264 锚 四 部 分 历 向 次 民 的 氛 作 系统 松 念 的 展示 : 艾 件 系统 和 和 扮 入 /输出 


方向 之 前 ， 也 会 要 求 磁头 移动 到 达 行进 方向 的 尽头 ， 即 磁盘 的 另 一 端 。 









et! 
图 14-17 循环 向 前 看 调度 算法 (磁道 号 减 小 的 方向 为 磁道 查找 方向 ) 


循环 向 前 看 调度 算法 (磁道 号 增 大 的 方向 为 磁道 查找 方向 ) 


一 一 pa 


Ta SA TR OE 
图 14-18 循环 向 前 看 调度 算法 〈 磁 道 号 增 大 的 方向 为 磁道 查找 方向 ) 


14.7.6， 先 来 先 服务 - 向 前 看 调度 算法 


另外 一 种 磁盘 调度 算法 通常 称 为 先 来 先 服务 - 向 前 看 调度 算法 〈 译 者 注 : 本 算法 英文 名 
称 为 F-SCAN ， 直 译 为 先 来 先 服务 - 扫描 算法 ， 但 其 实 本 算法 并 非 由 扫描 算法 而 是 由 向 前 看 
调度 算法 演化 而 来 ， 所 以 这 样 确定 中 文 名 称 更 为 恰当 )， 是 向 前 看 调度 算法 的 变种 算法 。 这 
种 算法 使 用 了 两 个 队列 ,不妨 称 作 队 列 X 和 队列 Y。 系 统 开启 时 首先 从 队列 X 开始 扫描 ， 
且 当 启动 扫描 时 ， 系 统 将 会 冻结 请 求 队列 X。 也 就 是 说 ， 在 这 轮 扫 描 已 经 开始 并 进行 着 的 过 
程 中 ， 新 到 达 的 任何 一 个 请 求 都 将 会 被 放 和 人 队列 Y 中 。 当 完成 队列 和 X 的 扫描 之 后 ， 就 会 冻 
结 队列 YY， 然后 开始 另 一 轮 的 对 队列 Y 的 扫描 ， 同 时 在 此 期 间 到 达 的 任何 一 个 请 求 都 会 被 
放置 进入 队列 X。 这 种 方法 避免 了 循环 向 前 看 调度 算法 高 代价 的 漫长 寻 道 开销 ， 对 先 来 先 服 
务 调度 算法 的 公平 性 和 向 前 看 调度 算法 的 高 效 性 进行 了 很 好 的 折 中 处 理 。 因 此， 这 种 算法 能 
够 避免 长 时 间 的 饥饿 问题 。 


14.7.7 NN 轮 向 前 看 调度 算法 


向 前 看 调度 算法 的 最 后 一 种 变种 算法 是 按照 组 请 求 来 分 批 依次 加 以 处 理 ， 先 扫描 完 
一 批 请 求 ， 之 后 再 处 理 下 一 批 请 求 ， 称 之 为 轮 向 前 看 调度 算法 ( 译 者 注 : 本 算法 英文 名 称 
为 N-step SCAN， 直 译 为 Y 步 扫描 算法 ， 但 其 实 本 算法 并 非 由 扫描 算法 而 是 由 向 前 看 调度 算 
法 演化 而 来 ， 所 以 这 样 确定 中 文 名 称 更 为 恰当 )。 就 像 先 来 先 服务 - 向 前 看 调度 算法 一 样 ， 
NN 轮 向 前 看 调度 算法 可 以 防止 无 限期 的 延迟 (饥饿 ),N 轮 向 前 看 调度 算法 的 另外 一 个 目的 是 ， 
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就 一 个 没有 被 服务 的 请 求 可 以 等 待 多 长 时 间 设 置 一 个 上 限 。 因 此 ， 对 于 负载 非常 重 的 系统 和 
拥有 大 量 软 实时 应 用 程序 的 系统 来 说 ， 这 种 算法 是 非常 有 用 的 。 注 意 ，X 轮 向 前 看 调度 算法 
的 效果 在 很 大 程度 上 取决 于 N 的 大 小 。 如 果 WX 等 于 1， 那么 X 轮 向 前 看 调度 算法 实际 上 就 
是 先 来 先 服务 调度 算法 ， 而 如 果 NN 足够 大 ， 即 大 到 几乎 所 有 的 请 求 在 第 一 轮 扫 描 中 都 可 以 
得 到 服务 ,那么 入 轮 向 前 看 调度 算法 就 相当 于 向 前 看 调度 算法 。 


14.7.8 Linux 调度 程序 


与 大 多 数 的 操作 系统 相 比 ，Linux 系统 拥有 更 多 可 用 的 调度 程序 变种 。 在 此 ， 我 们 将 主要 
研究 一 下 其 当前 所 支持 的 三 种 调度 程序 ， 它 们 均 基 于 我 们 已 经 介绍 过 的 各 类 算法 而 演化 形成 。 

预测 式 调度 程序 

预测 式 调度 程序 ( anticipatory scheduler) 曾 一 度 是 Linux 系统 中 默认 采用 的 磁盘 调度 程 
序 。 其 借鉴 了 搭便 车 调度 算法 的 请 求 合 并 处 理 机 制 ， 同 时 又 使 用 了 类 似 于 向 前 看 调度 算法 的 
单程 电梯 序列 。 其 独特 之 处 在 于 ， 如 果 它 认为 一 个 进程 会 在 附近 请 求 存 取 更 多 的 数据 ， 那 么 
在 一 个 同步 的 读 命令 完成 后 ， 它 会 通过 拖延 一 段 时 间 来 尝试 预测 读 操 作 请 求 。 而 如 果 有 一 个 
新 的 请 求 是 来 自 于 最 后 一 个 进程 且 与 当前 位 置 相 距 不 是 太 远 ,那么 它 就 会 逆转 寻 道 方向 。 

基于 截止 时 间 的 调度 程序 

基于 截止 时 间 的 调度 程序 ( deadline scheduler) 也 综合 运用 了 搭便 车 调度 算法 的 请 求 合 
并 处 理 机 制 及 类 似 于 向 前 看 调度 算法 的 单程 电梯 序列 ， 并 为 所 有 的 操作 强加 了 一 个 截止 时 
间 ， 用 以 预防 资源 饥饿 问题 。Linux 系统 往往 会 立即 从 写 请 求 返回 ， 并 将 数据 写 到 高 速 缓存 
中 。 因 此 ， 只 要 一 个 写 请 求 的 截止 时 间 还 没有 结束 ， 该 基于 截止 时 间 的 调度 程序 就 会 优先 处 
理 读 请 求 。 这 是 数据 库 系统 优先 选择 的 调度 程序 ， 特 别 是 在 高 性 能 磁盘 驱动 器 的 情况 下 。 

完全 公平 排队 调度 程序 

完全 公平 排队 调度 程序 ( complete Fair Queuing Scheduler，CFP Scheduler) 同样 也 集成 
运用 了 搭便 车 调度 算法 的 请 求 合 并 处 理 机 制 及 类 似 于 向 前 看 调度 算法 的 单程 电梯 序列 。 除 此 
之 外 ， 它 试图 赋予 使 用 特定 设备 的 所 有 进程 以 基于 标准 时 间 间 隔 的 相同 数量 的 同步 输入 / 输 
出 请 求 。 对 于 多 用 户 系统 来 说 ， 它 比 其 他 调度 程序 的 效率 要 更 高 一 些 ， 故 而 也 是 当前 大 多 数 
Linux 发 行 版 系统 中 默认 采用 的 磁盘 调度 程序 。 


14.7.9 向 控制 器 发 送 命令 


标记 式 排队 (tagged queuing) 最 初 是 在 小 型 计算 机 系统 接口 (SCSI) 类 型 的 磁盘 驱动 器 
领域 中 研制 出 来 的 一 种 技术 ， 有 时 称 之 为 命令 式 排 队 (command queuing) 或 本 地 命令 式 排 
队 (Native Command Queuing，NCQ)， 其 基本 的 思想 是 把 全 部 或 部 分 的 磁盘 操作 调度 任务 
委托 给 磁盘 控制 器 来 完成 。 进 一 步 说 ， 此 类 驱动 器 的 设备 驱动 程序 把 所 有 的 输入 /输出 请 求 
都 直接 地 传 给 了 磁盘 控制 器 ， 而 磁盘 控制 器 则 需要 完成 所 有 对 输入 /输出 操作 的 调度 。 其 理 
论 依据 是 ， 磁 盘 控制 器 拥有 磁盘 几何 结构 相关 的 一 个 不 同 层级 的 信息 以 及 磁盘 机 构 的 当前 状 
态 ， 故 而 可 以 更 好 地 完成 针对 多 个 磁盘 请 求 的 调度 任务 。 这 种 把 功能 向 硬件 迁移 的 现象 ， 我 
们 在 操作 系统 领域 中 可 以 经 常 看 到 。 一 旦 某 种 技术 证 实 了 在 操作 系统 中 很 有 用 ， 我 们 就 会 开 
始 考虑 把 相关 功能 植 人 硬件 中 ， 其 间 对 应 功能 实现 起 来 成 本 通常 会 更 低廉 ， 有 时 候 也 会 更 好 
一 些 ， 而 且 还 可 以 把 珍贵 的 处 理 器 和 内 存 资 源 解放 出 来 。 在 这 种 情况 下 ， 磁 盘 控 制 器 能 够 更 
好 地 完成 相应 工作 ， 是 因为 它 能 够 综合 考虑 和 权衡 旋转 延迟 的 因素 。 当 一 开始 利用 这 些 磁盘 
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调度 算法 来 完成 大 量 调度 工作 的 时 候 ， 寻 道 时 间 要 远 远 地 大 于 旋转 延迟 时 间 。 然 而 ， 在 过 去 
的 20 年 里 ， 在 寻 道 机 构 方 面 的 改进 已 意味 着 现在 的 寻 道 时 间 与 旋转 延迟 时 间 几 乎 没有 什么 
差别 了 (如 表 14-2 所 示 )。 一 般 来 说 ， 操 作 系统 并 没有 掌握 多 少 关 于 磁盘 驱动 器 的 旋转 位 置 
的 信息 。 除 此 之 外 ， 因 为 扇 区 分 组 机 制 和 逻辑 块 地 址 处 理 环节 ， 磁 盘 驱 动 程序 甚至 都 无 法 理 
解 磁盘 驱动 器 真正 的 几何 结构 。 然 而 ， 磁 盘 控 制 器 则 拥有 所 有 相关 信息 ， 并 因而 能 够 利用 一 
种 综合 考虑 旋转 延迟 时 间 和 寻 道 时 间 的 算法 来 实现 最 优 的 调度 。 据 报道 ， 在 许多 情况 下 相关 
性 能 已 经 提高 了 30%， 不 过 ， 这 在 很 大 程度 上 取决 于 特定 情况 和 具体 细节 。 在 大 多 数 的 现代 
操作 系统 中 ， 已 经 实现 了 标记 式 排队 。 同 时 ， 这 项 技术 现在 也 被 应 用 到 了 最 新 的 高 性 能 的 高 
技术 连接 系统 接口 (ATA) 类 型 的 磁盘 驱动 器 中 。 


14.7.10” 哪 种 算法 最 好 


在 讨论 了 所 有 的 这 些 磁盘 调度 算法 之 后 ,似乎 理所当然 地 就 想 知 道 哪 种 算法 才 是 最 好 
的 。 遗 憾 的 是 ， 这 个 问题 的 答案 依然 是 计算 机 行业 中 经 常会 听 到 的 那 名 话 一 一 “要 看 情况 而 
定 ”。 事 实 上 ， 没 有 一 种 算法 在 所 有 的 情况 下 都 是 最 好 的 。 具 体 来 说 ， 先 来 先 服 务 调度 算法 
最 为 简单 ， 而 且 消 耗 的 资源 最 少 。 如 果 一 个 系统 经 常 都 是 负载 非常 轻 的 情况 ， 在 队列 中 没有 
多 少 磁盘 请 求 ， 那 么 所 有 算法 的 表现 都 相差 无 几 一 一 就 像 先 来 先 服务 调度 算法 一 样 。 在 这 种 
情形 下 ， 其 他 算法 没有 一 种 可 被 证 明 是 有 道理 的 ( 译 者 注 : 言 外 之 意 ， 先 来 先 服务 调度 算法 
当仁不让 ， 应 为 首选 )。 

然而 ， 许 多 系统 经 常 都 是 中 度 甚至 重度 负载 ， 因 而 我 们 不 可 能 拿 着 如 此 简单 的 答案 就 能 
够 抽身 离开 。 在 这 样 的 场景 中 ， 先 来 先 服务 调度 算法 将 会 呈现 出 高 度 的 服务 可 变性 ， 反 而 往 
往 是 最 糟糕 的 选择 。 于 是 ， 下 一 个 需要 提出 的 问题 就 是 ,我们 试图 要 优化 哪些 参数 呢 ? 在 大 
多 数 情况 下 ， 我 们 在 尝试 最 优化 磁盘 的 吞吐 量 。 但 是 ， 我 们 之 前 就 曾 见 到 过 ， 最 大 吞吐 量 的 
产生 是 以 牺牲 那些 要 访问 不 在 最 佳 位 置 的 文件 的 进程 的 公平 性 作为 代价 的 。 这 些 请 求 要 么 是 
遭受 到 响应 时 间 的 严重 延迟 ， 要 人 么 是 遭遇 到 响应 时 间 变 化 的 不 可 预测 ， 因 此 ， 都 是 无 法 被 接 
受 的 。 如 果 程 序 可 以 适时 地 提醒 用 户 ， 那 么 用 户 还 是 能 够 容忍 慢 悠 悠 的 响应 的 ， 但 是 ， 响 应 
时 间 的 巨 幅 变化 会 使 程序 变 得 不 再 可 能 足够 有 效 地 提醒 用 户 。 为 此 ， 在 大 多 数 情况 下 ， 向 前 
看 调度 算法 的 一 些 变种 算法 则 可 能 是 最 好 的 ， 同 时 这 里 假设 你 的 系统 里 没有 包含 能 够 自己 处 
理 调度 的 新 型 设备 。 如 果 有 此 类 硬件 设备 可 以 使 用 ， 那 么 它 几 乎 肯定 会 比 操作 系统 做 得 更 好 。 


14.8 ”内 存 直接 存 取 型 控制 器 和 磁盘 硬件 特征 


因为 磁盘 控制 器 有 一 些 特 殊 的 硬件 特征 会 影响 到 操作 系统 的 设备 处 理 程序 的 设计 ， 所 以 
我 们 就 此 在 这 里 展开 进一步 针对 性 的 讨论 。 


14.8.1 内 存 直 接 存 取 型 控制 器 


最 初 ， 输 入 /输出 控制 器 被 设计 成 每 次 传递 一 字 节 (byte) 或 一 个 字 (word) 的 数据 。 首 
先 ， 处 理 器 将 会 把 控制 信息 加 载 到 适当 的 寄存 器 中 ， 这 些 控制 信息 包括 操作 类 型 ( 读 、 写 或 
控制 )、 内 存 地 址 以 及 可 能 的 设备 地 址 。 然 后 ， 人 处 理 器 将 会 发 出 一 条 输入 /输出 指令 。 当 输入 / 
输出 操作 完成 之 后 ， 控 制 器 便 会 发 出 一 个 中 断 信号 ， 于是， 处 理 器 就 会 开始 策划 传输 下 一 个 
字 或 字 节 。 这 对 于 像 键盘 、 调 制 解 调 器 ， 甚 至 在 非常 早期 的 个 人 计算 机 上 的 早期 的 纯 文本 显 
示 恬 (CRT) 等 设备 来 说 ， 还 是 可 以 接受 的 ， 因 为 在 下 一 个 中 断 发 生 之 前 ， 处 理 器 能 够 执行 
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非常 多 的 指令 ( 译 者 注 : 即 处 理 器 可 以 完成 自己 的 本 职工 作 )。 然 而 ,伴随 设备 变 得 越 来 越 
快 ， 中断 的 次 数 和 时 限 开始 把 处 理 占 压 得 有 点 员 不 过 气 来 ( 译 者 注 : 即 处 理 器 就 有 点 无 暇 顾 
及 自己 的 本 职工 作 了 )。 

为 此 ， 在 计算 机 的 输入 /输出 部 件 的 设计 中 产生 了 一 项 新 发 明 一 一 内 存 直接 存 取 (Direct 
Memory Access，DMA) 型 控制 器 。 主 处 理 器 将 向 内 存 直接 存 取 型 控制 器 提供 与 之 前 加 载 到 
寄存 器 中 的 信息 相同 的 信息 ， 同 时 还 会 加 上 和 欲 传输 数据 的 长 度 〈 针 对 读 或 写 操作 类 型 而 言 ) 。 
内 存 直 接 存 取 型 控制 器 将 承担 之 前 由 处 理 器 负责 完成 的 工作 ， 只 是 当 设备 控制 器 完成 一 个 字 
的 传输 时 ， 它 将 通告 内 存 直 接 存 取 型 控制 器 ， 而 不 是 去 中 断 处 理 器 。 伴 随 每 个 字 节 【或 字 ) 
传输 给 内 存 或 者 从 内 存 传 输 过 来 ， 内 存 直 接 存 取 型 控制 器 将 会 对 欲 传输 数据 的 计数 值 做 递减 
操作 ， 同 时 对 相应 的 内 存 地 址 做 递增 操作 。 当 欲 传输 数据 的 计数 值 变 为 0 时 ， 内 存 直接 存 取 
型 控制 咒 就 会 得 知 数据 传输 已 经 完成 ， 这 时 候 才 会 去 中 断 处理 器 。 这 项 技术 极 大 地 减少 了 处 
理 器 对 输入 /输出 管理 的 开销 。 许 多 现代 的 控制 器 一 般 会 在 控制 器 内 部 拥有 一 个 内 置 的 内 存 
直接 存 取 型 控制 电路 ， 而 不 是 与 其 他 的 控制 器 共享 一 个 内 存 直 接 存 取 型 控制 器 。 


14.8.2 ”磁盘 驱动 器 的 其 他 特征 


现代 的 磁盘 驱动 器 有 一 些 其 他 的 常见 特征 ,会 对 操作 系统 产生 影响 。 第 一 个 特征 就 是 磁 
盘 驱 动 咒 中 的 缓冲 机 制 。 现 在 的 小 型 磁盘 驱动 器 的 标准 规格 是 包含 8 MiB 的 内 存 (RAM),， 
这 部 分 内 存 可 用 作 高 速 缓存 (或 称 为 高 速 绥 存 存储 器 )。 在 这 种 场景 中 ， 其 也 可 称 作 磁道 组 
冲 (track buffer)。 当 前 ， 磁 盘 驱 动 器 性 能 的 主要 限制 因素 是 寻 道 时 间 和 旋转 延迟 时 间 的 组 
合 。 在 我 们 对 高 速 缓存 的 讨论 中 ,我 们 总 会 提 到 空间 局 部 性 一 一 其 基本 思想 是 指 ， 当 一 个 程 
序 引 用 一 块 数据 的 时 候 ， 它 极 有 可 能 很 快 就 会 去 引用 这 块 数据 ( 即 前 面 访问 过 的 数据 ) 附近 
的 那些 数据 。 如 果 我 们 正在 顺序 地 读 取 一 个 文件 ， 并 且 快 速 公平 地 处 理 相 关 数 据 块 ， 那 么 我 
们 可 能 会 请 求 访问 璧 如 5 号 扇 区 并 开始 对 其 进行 处 理 。 我 们 很 快 就 会 读 完 那个 扇 区 ， 然 后 请 
求 访问 6 号 局 区 。 然 而 与 此 同时 ，6 号 扇 区 已 经 开始 要 通过 磁头 了 ， 为 此 我 们 将 不 得 不 等 待 
磁盘 完 完整 整地 旋转 上 一 圈 ， 之 后 我 们 才能 够 读 取 6 号 扇 区 。 同 样 的 遭遇 也 会 在 7 号 扇 区 上 
发 生 ， 以 此 类 推 。 

因此 ， 当 我 们 向 一 部 现代 的 磁盘 驱动 器 发 送 一 条 命令 ,去 读 取 磁道 上 的 一 个 特定 局 区 的 
时 候 ， 一 且 磁 头 位 于 相应 磁道 之 上 ， 对 应 磁盘 驱动 器 往往 会 将 整 条 磁道 上 的 内 容 都 读 取 到 内 
存 中 。 如 果 下 一 个 出 现 的 是 10 号 扇 区 ， 人 磁盘 驱动 器 将 会 开始 读 取 10 号 户 区 ， 并 且 会 把 整 条 
磁道 读 完 ， 直 到 环绕 一 圈 读 取 到 了 9 号 扇 区 为 止 。 然 后 ， 其 将 会 返回 我 们 所 请 求 访问 的 那个 
扇 区 ， 同 时 把 读 和 的 其 他 扇 区 的 内 容 存 放 到 高 速 缓存 中 上 且 尽 可 能 长 的 时 间 ， 因 为 其 认为 我 们 
可 能 很 快 就 会 请 求 访问 其 中 的 某 些 数据 的 。 


14.8.3 ” 扇 区 保留 和 扇 区 迁移 


随 着 时 间 的 推移 ， 磁 盘 驱 动 器 将 会 开始 出 现 故障 。 不 过 ， 这 个 过 程 开始 得 很 慢 ， 最 初 可 
能 是 非常 平缓 的 。 偶 尔 ， 一 个 全 新 的 磁盘 驱动 器 也 可 能 一 开始 就 有 几 个 坏 的 鹿 区 。 为 了 妥善 
应 对 和 处 理 这 些 故障 ， 磁 盘 驱动 器 通常 在 格式 化 时 会 保留 一 些 “ 备 用 ”的 扇 区 散落 在 各 个 地 
方 一 一 也 许 每 条 磁道 也 就 保留 一 个 而 区 吧 。 这 些 记 区 起 先 阶 段 并 不 是 编号 方案 的 组 成 部 分 。 
相反 ， 它 们 是 以 储备 方式 持 有 的 ， 于 是 ， 当 检测 到 故障 的 时 候 ， 系 统 才 能 够 分 配 它 们 一 一 也 
就 是 说 ， 源 自 上 日 扇 区 的 数据 将 会 被 复制 到 备用 扇 区 中 ， 同 时 备用 肩 区 的 编号 亦 需 进 行 调整 以 
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B23] 匹配 出 现 了 故障 的 扇 区 。 这 时 ， 故 障 扇 区 会 获得 一 个 不 会 被 使 用 的 编号 。 在 某 些 情况 下 ， 驱 


动 器 硬件 可 以 执行 这 项 功能 。 而 在 另外 一 些 情况 下 ， 则 由 设备 驱动 软件 负责 完成 故障 恢复 和 
扇 区 迁移 (或 称 为 扇 区 重 定位 )。 


14.8.4 自我 监控 报告 技术 


扇 区 保留 是 一 种 被 动 的 技术 ， 它 解决 了 当 我 们 发 现 故障 时 应 当 如 何 处 理 故 障 的 问题 。 而 
自我 监控 报告 技术 ( Self-Monitoring And Reporting Technology，S.M.A.R.T.) 则 是 一 种 预测 
技术 ， 其 解决 的 是 我 们 如 何 预见 未 来 故障 以 及 如 何 避 免 或 缓解 相关 故障 。 自 我 监控 报告 技术 
是 一 种 标准 接口 ， 硬 盘 驱 动 器 可 以 通过 该 接口 ， 向 主机 操作 系统 报告 它 的 状态 ， 并 提供 对 未 
来 故障 日 期 的 估计 。 借 助 于 相关 充分 的 预告 信息 ， 系 统 或 用 户 就 可 以 在 驱动 器 故障 发 生 之 前 
对 数据 实施 备份 。 自 我 监控 报告 技术 是 为 高 技术 连接 系统 接口 ( ATA) 和 小 型 计算 机 系统 接 
口 (SCSI) 两 种 平台 定义 的 ， 由 康 柏 公司 (Compaq) 开创 ， 并 正 由 磁盘 驱动 器 制造 商 继 续 推 
动 和 发 展 。 

鉴于 驱动 器 架构 会 随 着 模型 的 不 同 而 变化 ， 所 以 自我 监控 报告 技术 针对 磁盘 驱动 器 的 每 
种 模型 都 包含 了 一 组 相应 的 参数 。 关 于 一 种 模型 的 故障 检测 的 属性 和 靖 值 ， 对 于 另外 的 一 种 
模型 来 说 ， 有 可 能 是 没有 用 的 。 为 了 拥有 一 个 彻底 全 面 的 可 靠 性 管理 方案 ， 磁 盘 驱动 器 必须 
能 够 监控 许多 要 素 。 相 关 方案 中 ， 至 关 重 要 的 因素 之 一 就 是 要 了 解 故障 模式 。 一 般 来 说 ， 故 
障 可 以 划分 为 两 类 : 可 预测 的 和 不 可 预测 的 。 

不 可 预测 故障 发 生 很 快 ， 像 电子 和 机 械 类 问题 ， 璧 如 ， 电 涌 可 能 引发 芯片 或 者 电路 故 
障 。 改 进 质量 、 设 计 、 过 程 和 制造 能 够 减少 不 可 预测 故障 的 发 生 。 例 如 ， 半 钢 子午 线 轮 胎 的 
发 展 就 减少 了 旧式 轮胎 设计 中 常见 的 爆 胎 的 次 数 。 

可 预测 故障 是 以 磁盘 驱动 器 出 现 故障 之 前 的 某 些 属性 伴随 时 间 推 移 而 呈现 出 来 的 退化 
为 特征 的 。 这 样 便 创造 了 属性 可 以 被 监控 的 情景 ， 从 而 使 预测 性 故障 分 析 成 为 可 能 。 一 般 来 
说 ， 许 多 机 械 性 故障 被 认为 是 可 预测 的 ， 例 如 ， 磁 头 飞行 高 度 的 降低 将 预示 着 潜在 的 磁头 碰 
撞 的 发 生 。 某 些 电子 故障 在 故障 发 生 之 前 也 会 出 现 属 性 退化 的 现象 ， 但 是 更 为 普遍 的 是 ， 机 
械 问 题 是 渐进 式 和 可 预测 性 的 。 例 如 ， 油 位 是 许多 汽车 上 可 被 监控 的 一 个 因 变 量 或 者 说 属 
性 ， 当 汽车 诊断 系统 感觉 到 油 位 偏 低 的 时 候 ， 油 位 指示 灯 就 会 变 亮 。 于 是 ， 驾 驶 员 就 可 以 停 
下 车 来 ， 以 保护 引擎。 同样 ， 自 我 监控 报告 技术 可 以 为 系统 管理 员 提 供 充 分 的 预告 信息 ， 让 
他 们 有 足够 的 时 间 开 启 备份 过 程 和 保存 系统 数据 。 通 常情 况 下 可 以 预测 的 机 械 性 故障 ， 占 到 
驱动 器 故障 的 60%。 这 项 数据 表明 可 靠 性 预测 技术 具有 很 大 的 应 用 潜力 。 拥 有 了 自我 监控 报 
告 技术 的 系统 ， 许 多 未 来 的 故障 就 可 以 被 预测 到 ， 从 而 也 就 可 以 避免 数据 的 丢失 。 


14.8.5 ”展望 未 来 


如 果 处 理 器 的 性 能 按 每 秒 每 美元 的 操作 数 来 进行 度量 ， 其 在 过 去 的 20 年 里 大 体 上 以 每 
年 100% 的 速度 递增 。 而 在 同一 时 间 段 里 ， 存 储 一 兆 字 节 数据 的 成 本 从 70 美元 降 到 了 1 美 
元 。 此 外 ， 磁 盘 驱 动 器 的 传输 速率 则 从 每 秒 传输 1MB 提高 到 了 每 秒 传输 超过 300MB。 尽 管 
如 此 ,我 们 把 磁盘 作为 辅助 存储 器 的 主要 制约 因素 是 平均 寻 道 时 间 和 旋转 延迟 时 间 。 而 在 同 
样 的 时 间 区 段 里 ， 二 者 分 别 仅仅 降低 了 大 约 10 倍 。 进 一 步 说 ， 旋 转 延迟 时 间 受 到 了 外 层 磁 
道 的 音速 的 限制 ， 而 且 这 种 情况 将 不 会 改变 。 这 就 意味 着 ， 这 两 个 因素 现在 可 以 完全 主导 用 
来 随机 访问 硬盘 上 的 任何 特定 信息 所 花费 的 时 间 。 总 之 ， 相 对 于 处 理 器 来 说 ， 驱 动 器 的 速度 
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仍然 是 很 慢 的 ， 这 便 加 剧 了 计算 机 系统 性 能 的 失衡 。 

在 操作 系统 方面 ， 我 们 为 磁盘 驱动 器 投放 了 大 量 内 存 块 用 作 高 速 缓存 ， 以 便 使 其 速度 看 
起 来 更 接近 于 内 存 的 速度 。 我 们 还 开发 了 精巧 的 调度 算法 以 优化 磁头 定位 机 制 的 性 能 。 总 的 
来 说 ,我 们 耗费 了 大 量 的 资源 ， 来 管理 这 些 越 来 越 和 处 理 器 不 同步 的 设备 。 

磁带 驱动 器 曾经 是 大 型 计算 机 系统 中 的 标准 的 辅助 存储 设备 。 但 是 在 20 世纪 70 年 代 ， 
它们 被 磁盘 驱动 器 所 取代 ， 从 而 在 这 个 角色 上 消失 了 。 不 过 磁带 并 没有 完全 退出 历史 舞台 ， 
由 于 其 低廉 的 存储 介质 成 本 ， 磁 带 驱动 器 于 是 降级 成 为 第 三 级 存储 器 。 现 在 越 来 越 明 显 的 
是 ， 同 样 的 事 需要 发 生 在 磁盘 驱动 器 上 。 尚 不 清楚 什么 样 的 新 型 设备 将 会 取代 磁盘 驱动 器 ， 
但 是 ， 我 们 在 此 做 一 个 强 有 力 的 预测 ， 在 未 来 的 5 一 10 年 ， 我 们 将 会 看 到 一 类 新 的 可 以 买 
得 到 的 存储 设备 ， 同 今天 的 磁盘 驱动 器 相 比 ， 这 种 设备 具有 近似 的 随机 延迟 但 更 为 低廉 的 成 
本 。 纯 电子 存储 器 和 微机 电 系 统 ( Micro Electro Mechanical System，MEMS ) 是 两 种 可 能 的 
候选 存储 设备 。 结 合 了 闪存 和 旋转 式 媒介 技术 的 混合 式 硬盘 ( Hybrid Hard Drive, HHD) 已 
经 可 以 在 市 面 上 买 得 到 了 。Windows Vista 操作 系统 已 经 能 够 利用 额外 的 内存， 以 作为 高 速 组 
存 的 一 个 高 速 扩展 部 分 。 这 一 章 中 所 介绍 的 大 部 分 的 技术 即将 面临 被 淘汰 的 命运 ， 而 我 们 必 
须 得 就 如 何 使 用 辅助 存储 器 进行 反思 。 或 许 ， 我 们 将 会 做 一 些 更 像 Palm 操作 系统 所 做 的 事情 。 


14.9 小 结 


在 这 一 章 中 ,我 们 介绍 了 低级 输入 /输出 的 管理 ， 其 中 着 重围 绕 辅 助 存储 器 和 磁盘 驱动 
右 展 开 说 明 。 接 着 ,我 们 讨论 了 一 些 主要 的 输入 /输出 设备 类 型 ， 以 及 它们 彼此 之 间 存 在 什 
么 不 同 之 处 。 我 们 描述 了 一 些 用 于 支持 输入 /输出 设备 的 通用 技术 。 然 后 ， 我 们 探讨 了 磁盘 
驱动 器 的 物理 结构 ， 以 及 存储 在 磁盘 驱动 器 上 面 的 信息 的 逻辑 组 织 。 我 们 还 讨论 了 廉价 磁盘 
宛 余 阵列 ， 即 好 多 磁盘 以 特殊 的 构 型 组 装 在 一 起 ， 用 来 实现 更 大 的 吞吐 量 及 更 高 的 可 靠 性 。 
本 章 还 阐述 了 非常 重要 的 磁盘 调度 操作 及 其 对 性 能 优化 的 改良 举措 。 我 们 还 探讨 了 一 种 称 为 
内 存 直 接 存 取 型 控制 器 的 特殊 类 型 的 设备 控制 器 ， 其 可 以 明显 地 降低 处 理 器 用 于 输入 /输出 
操作 的 负载 。 此 外 ， 我 们 也 讨论 了 磁盘 驱动 器 的 一 些 特征 ， 这 些 特征 往往 会 影响 操作 系统 的 
行为 、 驱 动 器 的 可 靠 性 等 。 
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习题 
14.1 “就 应 用 在 磁盘 系统 的 双 缓冲 和 高 速 缓存 进行 区 别 比 较 。 
14.2 ”磁盘 调度 算法 传统 上 忽略 旋转 延迟 时 间 的 理由 在 于 ， 甚 与 寻 道 时 间 相 比 是 非常 小 的 。 这 种 说 法 
是 否 正确 ? 
14.3 ”简要 给 出 柱 面 的 定义 。 
14.4” 下面 的 哪 一 种 磁盘 驱动 器 组 织 提 高 了 性 能 ， 但 是 没有 提供 宛 余 机 制 ? 
a. RAID 0 
b. RAID 1 
c. RAID 5 
d. RAID 6 
e. 上 述 所 有 的 选项 都 要 求 有 相同 数量 的 磁盘 驱动 器 
14.5 下 面 的 哪 一 种 磁盘 驱动 器 组 织 提供 了 宛 余 机 制 ， 但 是 在 额外 磁盘 驱动 器 方面 付出 了 最 高 的 代价 ? 
a.RAID0 
b. RAID 1 
c.RAID 5 
d. RAID 6 
e. 上 述 所 有 的 选项 都 要 求 有 相同 数量 的 磁盘 驱动 器 。 
14.6 RAID 6 与 RAID 5 相 比 ， 有 什么 优势 ? 
a. 它 在 读 取 多 数据 块 时 ， 要 更 加 快捷 
b. 它 在 写 操作 多 数据 块 时 ， 要 更 加 快捷 
c. 它 可 以 承受 同时 损坏 两 个 磁盘 驱动 器 的 故障 情况 
d. 它 要 求 更 少 的 额外 的 磁盘 驱动 器 
e. 以 上 都 不 是 RAID 6 相对 于 RAID 5 的 优势 
14.7 不 管 一 开始 选择 的 方向 是 向 里 还 是 向 外 ， 循 环 向 前 看 磁盘 调度 算法 寻 道 时 所 跨越 的 磁道 数量 都 
是 大 致 相同 的 。 这 种 说 法 是 否 正确 ? 
14.8 在 第 14 章 的 末尾 ， 我 们 讨论 了 为 提高 磁盘 系统 能 力 而 引入 的 几 种 机 制 。 在 这 些 机 制 中 ， 一 些 是 
用 于 提高 性 能 的 ， 一 些 是 用 于 改善 可 靠 性 的 。 下 面 哪 一 项 不 是 用 来 提高 性 能 的 ? 
a. 标记 式 排队 (本 地 命令 排队 ) : 
b. 磁盘 (控制 器 ) 硬件 缓冲 
c. 动态 内 存 访 问 
d. 扇 区 保留 
e. 以 上 都 是 为 了 提高 性 能 的 
14.9 首 字母 缩 略 词 CHS 指 的 是 什么 ? 
14.10 个 人 计算 机 硬盘 上 的 第 一 个 扇 区 中 包含 什么 ? 
14.11 如 果 说 先进 先 出 调度 算法 ( FIFO) 是 最 公平 的 (从 定义 上 看 是 如 此 )， 那 我 们 为 什么 不 使 用 这 种 
算法 呢 ? 
14.12 简要 描述 搭便 车 磁盘 调度 算法 。 
14.13 ”为 什么 要 引入 磁盘 分 区 的 概念 呢 ? 
14.14 ”在 磁盘 驱动 器 上 ,循环 元 余 校 验 码 (CRC) 或 纵向 元 余 校 验 码 (LRC) 有 什么 作用 ? 
14.15 在 磁盘 驱动 器 上 ， 错 误 校 验 码 (ECC) 有 什么 作用 ? 
14.16 ”循环 向 前 看 调度 算法 是 如 何在 向 前 看 调度 算法 的 基础 上 改进 的 ? 
14.17 内 存 直接 存 取 型 控制 器 的 主要 优势 是 什么 ? 
14.18 ” 茶 些 新 的 磁盘 驱动 器 支持 本 地 命令 排队 或 者 说 标记 式 排 队 。 这 究 竞 是 一 种 什么 样 的 技术 ?为 什 
rh 么 说 它 是 一 个 进步 ? 
328| 14.19 某 些 新 的 磁盘 驱动 器 支持 所 谓 的 自我 监控 报告 技术 (S.M.A.R.T)。 这 又 是 一 种 什么 样 的 技术 呢 ? 
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Operating Systems: A Spiral Approach 


网 络 、 分 布 式 系统 及 安全 





我 们 在 这 一 部 分 所 阐述 的 话题 并 非 在 所 有 的 操作 系统 教材 中 都 会 出 现 。 有 一 
位 声名 狼藉 的 计算 机 硬件 系统 官员 曾 指 出 ,“ 网 络 就 是 计算 机 ”。 这 是 一 种 奇怪 的 
论调 ， 但 是 它 确实 凸显 了 我 们 现在 对 网 络 连 接 的 重视 ， 大 多 数 计 算 机 一 般 都 会 与 
其 他 的 计算 机 连接 在 一 起 ， 尤 其 是 会 连接 到 互联 网 上 。 为 此 ， 本 书 的 这 一 部 分 将 
会 围绕 操作 系统 中 涉及 网 络 连接 、 分 布 式 系统 以 及 在 有 关 情 况 下 所 出 现 的 安全 与 
保护 问题 等 相关 方面 的 内 容 展 开 讨 论 。 

第 15 章 主要 介绍 计算 机 网 络 连接 的 基础 知识 。 这 个 话题 本 身 就 是 许多 计算 
机 科学 教科 书 的 主题 ， 也 是 一 个 非常 活跃 的 研究 领域 ， 故 而 在 这 里 仅 做 一 些 简明 
扼要 的 冰 述 。 我 们 采用 自 顶 向 下 的 方法 来 论述 大 多 数 现 如 今 所 用 到 的 硬件 和 协 
议 。 当 然 ， 互 联网 功能 方面 的 内 容 会 偏重 一 些 。 相 关 主 题 涵 盖 我 们 想 要 把 计算 机 
连接 到 一 起 以 形成 网 络 的 理由 、 应 用 层 协议 、 传 输 控制 协议 /网 际 协 议 、 数 据 链 
路 层 、 广 域 网 、 物 理 层 和 网 络 管理 以 及 远程 监控 。 

鉴于 简单 的 单 用 户 系 统 没有 通过 网 络 相 互 连 接 起 来 ， 故 而 往往 不 需要 保护 和 
安全 机 制 ， 所 以 即使 有 ， 早 期 的 操作 系统 也 没有 在 这 方面 提供 很 多 功能 。 然 而 ， 
现在 我 们 可 以 发 现 ,， 许多 机 器 都 拥有 多 个 用 户 ， 尤 其 是 家 里 的 计算 机 ， 大 多 数 都 
会 连接 到 局 域 网 或 者 互联 网 上 。 因 此 ， 安 全 是 当前 一 项 非常 重要 的 考量 因素 ， 而 
且 我 们 将 会 在 第 16 章 就 有 关内 容 展 开 讨 论 ， 相 关 话 题 包 括 身 份 认证 、 授 权 和 加 密 。 

计算 机 联网 后 ， 我 们 很 快 就 开始 开发 某 些 部 分 是 运行 在 不 同 的 计算 机 上 的 系 
统 ， 即 分 布 式 系统 。 故 而 ， 这 便 成 为 第 17 章 的 主题 。 同 样 ， 这 也 是 一 个 出 现在 
许多 书本 和 课程 中 的 主题 ， 并 且 目 前 许多 研究 工作 正在 这 一 领域 热火 朝天 地 开展 
着 ， 所 以 相关 论述 也 是 非常 简洁 的 ， 就 像 第 16 章 的 处 理 一 样 。 有 关内 容 主 要 包 
括 通信 、 进 程 、 命 名 机 制 、 其 他 分 布 式 系统 模型 、 同 步 以 及 容错 。 
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我 们 之 所 以 学 习 操作 系统 ， 是 因为 如 果 对 操作 系统 的 有 关 功 能 和 机 理 没有 一 个 充分 正 
确 的 理解 和 认识 ， 那 么 就 不 可 能 写 出 大 型 的 高 性 能 的 应 用 程序 。 公 平地 讲 ， 今 天 我 们 学 习 计 
算 机 网 络 也 是 出 于 同样 的 理由 一 一 如 今 编写 的 大 型 应 用 程序 ， 没 有 使 用 网 络 技术 的 情况 非常 
罕见 。 故 而 ,一 般 说 来 对 操作 系统 是 正确 的 ， 对 网 络 而 言 也 是 正确 的 。 进 一 步 说 ， 如 果 对 基 
本 的 网 络 连接 没有 一 个 充分 正确 的 理解 和 认识 ， 那 么 就 无 法 构建 和 部 署 大 型 的 分 布 式 应 用 
系统 。 

本 章 首先 针对 我 们 想 要 把 计算 机 通过 网 络 连 接 起 来 的 理由 进行 简要 介绍 和 解释 说 明 。 
接 下 来 ， 在 第 15.2 节 ， 我 们 就 传统 上 在 计算 机 网 络 讨论 过 程 中 所 采用 的 网 络 功能 层次 模 
型 进行 了 阐明 。 进 而 ， 在 第 15.3 节 描 述 了 应 用 层 所 采用 的 一 些 典型 的 协议 。 在 第 15.4 
节 中 ， 我 们 以 传输 控制 协议 /网 际 协议 为 例 ， 具 体 讨论 了 传输 层 和 网 络 层 。 在 第 15.5 
节 ， 我 们 把 以 太 网 作为 代表 ,论述 了 局 域 网 中 的 数据 链 路 层 。 其 后 ,我 们 在 第 15.6 节 概 
要 说 明了 广域网 的 数据 链 路 技术 ， 在 第 15.7 节 介 绍 了 物理 层 所 使 用 的 技术 ， 而 在 第 15.8 
节 则 简要 讨论 了 网 络 管理 的 相关 主题 。 最 后 ， 我 们 在 第 15.9 节 对 本 章 内 容 进行 了 归纳 
总 结 。 


15.1 为 什么 要 把 计算 机 通过 网 络 连接 起 来 


我 们 之 所 以 想 要 建立 一 个 分 布 在 网 络 上 的 应 用 程序 ， 从 更 为 详细 的 级 别 上 而 言 可 以 归 为 
几 个 原因 。 在 计算 机 系统 不 断 发 展 和 日 渐 成 熟 的 过 程 中 ， 我们 希望 使 用 网 络 的 最 初 起 因 是 和 
共享 访问 昂贵 资源 联系 在 一 起 的 。 一 开始 ， 相 应 的 资源 也 就 是 一 台大 型 计算 机 ( mainframe 
computer 或 mainframe)， 我 们 通过 简易 的 终端 而 不 是 个 人 计算 机 对 其 进行 访问 ， 我 们 访问 存 
放 在 大 型 计算 机 上 的 数据 以 及 在 那里 运行 的 程序 。 之 后 ， 随 着 局 域 网 ( Local Area Network， 
LAN) 的 逐渐 普及 ， 我 们 开始 使 用 局 域 网 来 访问 其 他 的 共享 设备 ， 壁 如 一 个 部 门 的 文件 服务 
器 、 一 台 价格 不 菲 的 激光 打印 机 、 一 个 调制 解 调 器 池 以 及 附属 的 通信 线路 。 这 些 资源 如 果 要 
提供 给 每 一 个 用 户 就 会 花费 太 多 的 钱 ， 而 且 这 些 资源 通常 情况 下 也 不 会 每 时 每 刻 都 在 使 用 。 
因此 ， 让 这 些 资源 可 以 通过 网 络 来 进行 访问 ， 就 把 相关 费用 分 散 和 均 摊 到 许多 用 户 身上 。 诚 
然 ， 共 享 资源 使 用 起 来 可 能 不 如 直接 使 用 本 地 资源 那样 方便 ， 然 而 大 幅 缩减 的 成 本 足以 弥补 
这 一 弱点 。 另 一 个 共享 昂贵 设备 的 具体 例子 是 把 各 个 系统 备份 到 拥有 附属 三 级 存储 设备 如 可 
能 是 磁带 驱动 器 的 机 器 上 。 

随 着 网 络 变 得 越 来 越 普遍 ， 某 些 可 以 利用 网 络 来 完成 的 特殊 事情 也 逐渐 明朗 化 。 其 中 
一 项 特殊 的 事情 就 是 通过 把 几 台 较 小 型 的 机 器 以 完 余 配置 的 方式 组 合 起 来 构建 一 个 系统 ， 那 
样 ， 即 便 其 中 有 一 台 机 器 发 生 了 损坏 ， 整 个 系统 仍然 能 够 继续 王 作 ， 纵 然 是 以 一 种 降级 退化 
的 方式 在 运作 着 。 

有 些 时 候 ， 我 们 会 把 一 个 进程 的 计算 任务 分 配 到 多 台 计 算 机 上 以 提高 运算 速度 。 我 们 把 
有 关 处 理 过 程 分 解 成 能 由 每 台 机 器 单独 处 理 的 更 小 的 模块 。 类 似 地 ， 可 以 把 多 台 较 小 型 的 机 
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器 配置 到 一 个 系统 中 ， 而 且 伴随 有 关 应 用 程序 规模 的 扩展 还 可 以 加 入 其 他 的 机 器 。 例 如 ， 这 
便 允 许 一 家 公司 开始 时 只 使 用 一 台 机 器 来 运营 网 站 ， 而 伴随 相关 需求 的 增长 ， 对 应 网 站 还 


可 以 成 功 添置 新 的 系统 。 成 本 因素 是 采用 系统 聚集 的 方式 提升 速度 的 重要 原因 。 在 某 些 情况 


下 ， 由 于 涉及 大 量 的 数据 和 处 理工 作 ， 所 以 有 些 应 用 程序 利用 单个 的 大 型 系统 根本 就 不 可 能 
完成 。 或 者 在 某 些 情况 下 ， 尽 管 一 台大 型 的 计算 机 可 以 完成 有 关 工作 ， 但 是 因为 成 本 问题 而 
无 法 实现 。 然 而 ， 相 关系 统 可 以 被 设计 成 使 用 许多 较 小 的 处 理 器 ， 从 而 化 解 这 一 成 本 难题 。 
或 许 ,“ 外 星 文明 探寻 ”( SETI) 项 目 可 以 算得 上 此 类 系统 的 第 一 个 例子 。 该 项 目 收集 大 量 的 
射电 望远镜 的 数据 并 将 其 通过 互联 网 发 送 给 有 关 用 户 ， 而 这 些 用 户 自愿 使 用 通常 只 在 后 台 运 
行 的 “屏幕 保护 ”应 用 程序 来 处 理 相关 数据 。 这 一 应 用 程序 旨 在 查找 可 能 代表 另 一 个 星球 上 
的 智能 生命 体 的 信号 。 现 在 ,“ 外 星 文明 探寻 ”屏幕 保护 程序 已 经 拥有 数 百 万 的 注册 用 户 。 
这 被 看 作 一 个 针对 多 个 数据 流 实 施 并 行 操作 的 单一 的 、 松 散 耦 合 的 系统 ， 故 而 成 为 整个 世界 
上 最 快 的 超级 计算 机 ( supercomputer)。 一 个 非 营 利 组 织 是 没有 办 法 买 得 起 拥有 这 样 超然 处 
理 能 力 的 系统 的 ， 因 此 ， 如 果 不 采用 这 一 技术 ， 有 关 任 务 确实 永远 都 无 法 完成 。“ 外 星 文 
明 探 寻 ” 是 第 一 个 这 样 的 系统 ， 不 过 今天 已 经 有 许多 类 似 的 处 理 数 据 的 其 他 系统 ， 正 在 从 
事 密码 学 ( cryptography)、 脱 氧 核糖 核酸 ( Deoxyribo Nucleic Acid，DNA)、 数 学 、 重 力 波 
(gravity wave) 以 及 其 他 的 科学 项 目 研 究 。 我 们 将 在 下 一 章 讨论 分 布 式 系统 时 再 次 探讨 这 个 
话题 。 

经 过 近 几 年 互联 网 的 巨大 发 展 之 后 ， 网 络 的 深远 影响 已 经 变 得 非常 清晰 ， 即 对 信息 访 
问 的 急剧 增长 。 当 前 互联 网 相对 快速 的 响应 时 间 使 以 往 并 不 经 济 的 信息 交换 方式 已 变 得 切 
实 可 用 ,“ 远 程 办 公 ”( telecommuting) 即 在 家 办 公 的 设想 就 是 一 个 例子 。 许 多 工作 要 求 在 员 
工 之 间 开 展 频繁 的 、 持 续 的 互动 。 从 某 种 程度 上 而 言 ， 这 种 互动 可 以 通过 电子 邮件 来 近似 
实现 ， 而 更 加 紧密 的 互动 则 可 以 借助 于 即时 通信 软件 一 一 一 种 交互 式 “ 聊 天 ”机 制 来 实现 。 
在 另外 一 些 情况 下 ， 这 种 交互 可 能 要 求 语音 通信 (voice communication)、 共 享 白板 ( shared 
whiteboard) 甚至 视频 会 议 ( videoconferencing)。 现 在 ， 如 果 以 较 低 的 价格 可 以 获得 足够 的 
带宽 ,那么 所 有 这 些 都 可 以 通过 互联 网 来 加 以 实现 ， 而 且 可 能 让 我 们 中 的 更 多 的 人 能 够 呆 在 
家 庭 办 公 室 而 不 是 通勤 到 一 个 中 心 办 公 室 来 工作 ， 至 少 在 业余 时 间 是 这 样 。 所 以 ， 网 络 能 
够 减少 通勤 所 必需 的 资源 消耗 (以 及 由 此 所 产生 的 污染 )， 从 而 有 助 于 解决 某 些 相 关 的 社会 
问题 。 

另外 还 有 一 些 通 过 互联 网 来 共享 信息 的 例子 。 我 们 有 可 能 与 住 在 世界 上 某 个 遥远 地 方 的 
革 些 人 展开 合作 来 共同 完成 某 个 项 目 。 例 如 ， 想 想 那些 一 起 工作 、 创 建 Linux 的 各 种 实用 例 
程 库 的 人 们 ， 正 是 因为 有 了 这 些 实用 例 程 库 ， 才 使 得 Linux 操作 系统 不 再 仅仅 是 一 个 有 趣 的 
内 核实 例 ， 而 是 一 个 完整 的 系统 。 他 们 中 的 大 多 数 人 很 有 可 能 从 来 没有 见 过 面 ， 而 只 是 通过 
互联 网 在 一 起 工作 里 了 。 

从 一 个 不 那么 热门 的 层面 上 来 说 ， 想 想 互联 网 的 普通 用 户 。 现 在 ,我们 中 的 大 多 数 人 每 
天 都 在 使 用 电子 邮件 ， 并 且 经 常 利用 网 络 资源 来 回答 问题 、 查 找 人 员 信 息 、 购 买 产品 、 下 载 
软件 更 新 代码 、 处 理 我 们 的 个 人 银行 和 其 他 的 金融 交易 ， 等 等 。 如 果 没 有 互联 网 ， 此 类 事情 
将 无 法 完成 。 尽 管 网 络 最 初 是 由 于 某 些 其 他 的 原因 而 存在 的 ， 但 信息 共享 一 直 是 其 一 项 主要 
的 功能 。 我 们 认为 ， 在 将 来 有 可 能 你 运行 的 大 多 数 应 用 程序 将 会 以 多 个 部 分 在 多 台 主 机 上 
的 方式 来 加 以 运行 ， 故 而 ， 如 果 你 对 网 络 本 身 以 及 操作 系统 如 何 使 用 网 络 没有 一 些 必要 的 理 
解 ， 那 么 你 将 无 法 设计 出 完好 的 应 用 程序 。 
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15.2 ”基础 知识 
15.2.1 ”相关 模型 


为 了 研究 和 实现 网 络 ， 传 统 上 ， 一 些 模 型 被 建立 起 来 ， 把 有 关 主 题 细 分 成 若干 小 的 主 
题 ， 并 将 它们 部 署 到 软件 的 各 个 层级 上 。 在 这 些 模型 中 ， 每 一 较 低 层级 往往 会 为 紧邻 的 较 高 
层级 提供 某 些 服务 。 尽 管 通常 情况 下 会 就 什么 样 的 功能 在 什么 层级 执行 制定 出 相当 不 错 的 协 
议 ， 然 而 这 些 模型 并 非 完美 无 皱 ， 故 而 也 不 会 总 是 被 严格 遵循 。 由 此 导致 的 结果 是 ， 有 时 会 
发 现 某 些 功 能 出 现在 了 多 个 层次 上 。 例 如， 我 们 几乎 在 每 一 层级 中 都 可 以 发 现 和 找到 安全 功 
能 。 此 外 ， 在 某 些 情况 下 ， 把 一 个 低级 层次 上 的 网 络 协议 拿 来 并 使 其 作为 男 一 更 高 层级 协议 
上 面 的 一 层 来 加 以 运行 可 能 非常 有 效 和 益处 多 多 。 在 这 些 情况 下 ， 层 次 模型 可 能 会 变 得 相当 
混乱 不 清 。 这 些 模型 在 整理 和 组 织 我 们 的 思路 方面 依然 十 分 有 用 ， 而 且 大 部 分 关于 网 络 的 文 
献 都 是 围绕 它们 来 进行 组 织 的 。 因 此 我 们 将 简明 扼要 地 针对 有 关 模 型 展开 讨论 。 需 要 说 明 的 
是 ,操作 系统 软件 通常 就 是 按照 这 些 层次 方式 来 进行 模块 化 设计 的 。 

最 广为人知 的 网 络 层次 模型 称 为 开放 系统 互 连 模型 (Open System Interconnect model，OSI 
模型 )， 如 图 15-1 所 示 。 它 是 由 国际 标准 化 组 织 (International Standards Organization，ISO) 建立 
的 。 该 模型 只 是 一 种 抽象 设计 方案 ， 并 没有 考虑 当时 已 有 的 任何 协议 ， 不 过 后 来 围绕 这 一 模型 
曾经 设计 出 了 一 系列 协议 。 而 在 GOSSIP 协议 〈 译 者 注 : 一 种 去 中 心 化 、 容 错 并 保证 最 终 一 致 
性 的 协议 ) 的 大 余下， 美国 政府 甚至 还 曾 一 度 强制 要 求 在 由 政府 购买 的 所 有 计算 机 系统 上 实现 
这 些 协议 。 然 而 ， 有 关 努 力 并 没有 取得 成 功 ， 故 而 最 终 被 迫 放 弃 。 作 
为 一 种 抽象 模型 ， 开 放 系 统 互 连 模 型 确实 存在 一 些 问 题 ， 最 突出 的 问题 
在 于 ， 其 中 有 两 个 层次 ， 即 会 话 层 和 表示 层 ， 几 乎 从 来 未 曾 被 实现 过 。 

根据 开放 系统 互 连 模型 ， 构 建 了 用 于 描述 业已 存在 的 传输 控制 协 
议 / 网 际 协议 复 (TCP/IP protocol suite) 的 另 一 种 模型 。 这 种 模型 主 
要 集中 在 上 面 的 几 层 (大 多 数 是 传输 控制 协议 和 网 际 协 议 )， 而 几乎 
忽略 了 那些 较 低 的 层级 。 显 然 ， 这 种 模型 认为 硬件 和 驱动 程序 仅仅 是 
商品 而 已 ， 故 而 可 以 从 供应 商 那里 采购 获得 。 

在 本 章 中 ,我 们 采用 了 一 种 通用 的 混合 模型 ， 其 大 致 由 开放 系 
统 互 连 模型 的 底部 两 层 和 传输 控制 协议 / 网 际 协议 模型 的 顶部 三 层 组 
成 ， 如 图 15-2 所 示 。 物 理 层 ( physical layer) 定义 了 用 于 通信 的 实际 
媒介 (medium ， 或 称 为 介质 ) 以 及 在 相应 媒介 上 获取 信息 的 技术 ,有 图 15-1 开放 系统 互 连 
关 媒 介 可 能 是 金属 电线 或 电缆， 也 可 能 是 光纤 或 电磁 信号 。 数 据 链 路 网 络 层次 模型 
层 〈data link layer) 负责 访问 共享 的 媒介 ， 主 要 致力 于 把 信息 打包 成 ”< 一 一 
独立 的 数据 包 并 且 仲 裁 对 网 络 媒介 的 访问 。 现 在 ， 称 为 网 桥 ( bridge) 
或 交换 机 ( switch) 的 数据 链 路 层 设 备用 来 连接 相应 设备 ， 并 使 每 一 
对 设备 就 像 直 接 相 互 连 接 一 样 ， 所 以 介质 访问 仲裁 功能 在 很 大 程度 上 
已 不 再 使 用 ， 而 且 这 种 趋势 日 渐 加 剧 和 愈 发 明显 。 网 络 层 (network 
layer) 负责 为 信息 在 互联 网 中 流通 选择 相应 的 传输 路 径 ， 这 里 的 互联 
网 是 由 许多 通常 基于 不 同 物理 层 技 术 的 网 络 所 组 成 的 复杂 网 络 。 传 输 
层 (transport layer) 主要 负责 在 两 个 网 络 实体 之 间 创 建 一 个 可 靠 的 连 
接 ， 尽管 并 不 是 所 有 的 应 用 程序 都 需要 这 样 的 一 种 连接 或 可 靠 性 保 图 15-2 一 种 实用 的 网 
证 。 最 后 ， 应 用 层 ( application layer) 则 由 一 台 主 机 上 的 与 (通常 是 ) 络 层次 模型 
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另 一 台 不 同 主机 上 的 进程 进行 数据 交换 的 进程 所 组 成 。 

对 于 连接 到 网 络 上 的 设备 而 言 ， 每 一 层 都 会 存在 一 个 实体 用 来 负责 该 设备 在 相应 层级 的 
功能 。 在 物理 层 ， 相 应 实体 位 于 硬件 中 。 而 数据 链 路 层 的 一 些 功能 可 能 也 在 硬件 中 实现 。 对 
于 大 多 数 设备 而 言 ,在 其 他 层 的 实体 都 是 软件 。 每 个 实体 依赖 于 其 下 面 一 层 的 实体 通过 应 用 
程序 接口 为 其 提供 服务 。 相 应 地 ， 每 一 实体 将 为 其 上 面 的 一 层 提供 服务 。 当 发 送 方 设备 的 一 
个 数据 包 沿 着 各 个 层级 从 一 个 实体 传递 到 下 一 个 实体 时 ， 每 个 实体 都 会 在 该 数据 包 的 前 面 增 
加 一 小 块 信息 ， 这 块 信息 被 称 为 报头 (header)。 例 如 ， 一 个 数据 包 ( data packet) 可 能 带 有 
应 用 层 报 头 、 传 输 控 制 协议 报头 、 网 际 协议 报头 、 以 太 网 报头 以 及 物理 层 报头 。 而 随 着 该 数 
据 包 沿 着 接收 方 设 备 的 协议 栈 向 上 传输 ， 每 个 实体 将 会 依次 剥离 掉 相 应 层级 的 报头 ， 然 后 将 
对 应 数据 包 继续 传递 给 更 高 的 层级 。 为 此 ， 这 些 报头 承载 了 在 发 送 方 设 备 和 接收 方 设备 的 对 
应 层次 的 实体 之 间 进 行 会 话 的 功能 。 

把 网 络 连接 技术 划分 为 若干 层级 既 有 好 的 一 面 ， 也 有 不 好 的 一 面 。 从 好 的 方面 来 讲 ， 小 
模块 更 容易 被 人 理解 ， 也 更 有 利于 开发 和 调试 。 如 果 开 发 出 了 改进 的 版 本 ， 相 关 模 块 也 可 以 
用 新 的 对 等 的 模块 进行 替换 。 不 同 的 组 织 可 以 专门 针对 不 同 的 层级 开展 研发 工作 ， 从 而 设 
计 出 更 好 的 算法 并 给 出 更 优 的 开发 实现 。 男 一 方面 ， 这 样 一 来 ， 我 们 清晰 地 规定 各 层级 之 
间 的 接口 以 及 发 送 方 主机 和 接收 方 主机 的 实体 之 间 的 会 话 就 显得 格外 重要 。 为 此 ， 产 生 了 
许多 不 同 来 源 的 标准 。 在 某 些 情况 下 ， 我 们 拥有 事实 上 的 标准 ( de facto standard， 或 称 为 事 
实 标准 ) : 或 者 是 某 家 厂商 首先 想 出 一 种 不 错 的 方案 ， 而 后 其 他 厂商 纷纷 效仿 ， 或 者 是 某 些 
供应 商 和 用 户 汇 聚 一 和 营 ， 共 同 就 某 种 标准 达成 一 致 。 在 另外 一 些 情况 下 ， 我 们 则 拥有 法 定 
的 标准 (de jure standard， 或 称 为 法 定 标准 ) : 从 技术 上 来 讲 ， 这 些 标准 的 背后 往往 带 有 法 律 
的 效力 。 进 一 步 说 ， 有 关 标 准 是 由 专业 的 、 国 家 的 或 国际 的 组 织 ， 璧 如 电气 电子 工程 师 协 
会 (Institute of Electrical and Electronic Engineers，IEEE)、 美 国 国家 标准 化 组 织 ( American 
National Standards Institute，ANSI) 以 及 国际 标准 化 组 织 等 制定 的 。 在 网 络 领域 ， 许 多 标准 
具体 是 由 互联 网 工程 任务 组 (Internet Engineering Task Force，IETF) 的 成 员 制 定 的 。 每 项 这 样 
的 标准 均 被 称 为 一 项 互联 网 标准 草案 ( Request for Comment; RFC)。 在 http://www.ietf.org/rfc. 
html 的 网 站 上 包含 了 相关 文档 。 我 们 通常 不 时 地 通过 RFC 来 定义 互联 网 协议 的 某 些 方面 。 


15.2.2 ”局域网 与 广域网 


可 以 采用 若干 不 同 的 方式 来 看 待 各 种 可 能 的 网 络 技术 。 而 每 种 不 同 的 观点 均 需 阐明 网 络 
之 间 的 差异 以 及 它们 的 性 能 特征 。 我 们 要 考虑 的 第 一 种 主要 特性 是 拓扑 结构 (topology) 一 一 
什么 是 各 机 器 之 间 的 连接 模式 ? 理解 网 络 的 一 部 分 困难 来 源 于 一 个 网 络 的 物理 拓扑 结构 可 能 
跟 它 的 逻辑 拓扑 结构 并 不 相同 。 关 于 网 络 拓 扑 的 第 一 种 粗略 的 划分 结果 是 局 域 网 ( Local 
Area Network，LAN) 和 广域网 (Wide Area Network，WAN) 9，。 一般 来 说 ， 广 域 网 中 的 


日 一 些 关于 网 络 的 教科 书 还 把 城 域 网 ( Metropolitan Area Network，MAN) 作为 另外 一 种 不 同 的 类 型 ， 但 是 
有 关 区 别 在 这 里 并 没有 多 大 效用 。 

日 “一些 机 构 或 学 术 权 威 明确 提出 ， 局 域 网 和 广域网 的 区 别 是 一 个 地 理 问 题 : 局 域 网 往往 处 于 一 个 狭小 的 区 
域 范围 中 ， 而 广域网 则 分 布 在 一 个 广阔 的 区 域 范围 内 。 然 而 事实 上 ， 地 理 因 素 所 导致 的 连接 特征 差异 非 
常 小 。 一- 方面， 光纤 分 布 式 数据 接口 (Fibre Distributed Data Interface，FDDI) 局 域 网 能 够 覆盖 的 距离 超 
过 100 千 米 。 男 一 方面 ， 在 以 往 经 常 可 以 见 到 ， 两 部 调制 解 调 器 分 别 位 于 两 台 主 机 的 顶层 ， 并 通过 广 域 
网 机 制 以 及 一 根 一 二 英尺 的 电线 相互 连接 ， 因 为 相关 机 制 是 两 个 系统 唯一 共同 的 接口 。 从 技术 上 来 说 ， 
这 是 一 种 广域网 连接 ,但 其 显然 不 具备 地 理 上 分 布 的 特征 。 
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网 络 连接 是 点 对 点 的 。 也 就 是 说 ， 当 两 个 系统 相连 接 的 时 候 ， 通 信和 只 在 这 两 台 主 机 之 间 进 
行 ， 而 对 其 他 任何 主机 是 不 可 见 的 。 因 此 ， 有 关 数 据 包 中 并 不 需要 包含 地 址 信息 ， 因 为 只 有 
一 台 设 备 来 读 取 它 们 。 而 既然 没有 地 址 ， 所 以 就 没有 办 法 发 送 广播 式 数据 包 (broadcast 
packet， 指 一 种 面向 连接 到 网 络 的 所 有 设备 的 数据 包 ) 或 组 播 式 数据 包 (multicast packet， 指 
一 种 面向 针对 某 一 特定 传输 流感 兴趣 的 相关 设备 的 数据 包 )。 通 常情 况 下 ， 广 域 网 连接 采用 
全 双 工 (full duplex) 模式 ， 这 意味 着 两 台 主 机 可 以 同时 进行 传输 。 另 外 ， 由 于 连接 可 以 同 
时 从 两 个 方向 使 用 和 开展 工作 ， 所 以 就 不 需要 针对 介质 访问 进行 仲裁 一 一 一 台 准 备 就 绪 和 即 
将 传输 的 主机 已 经 那样 做 了 。 

另 一 方面 ， 传 统 上 局 域 网 采用 广播 连接 方式 。 当 两 台 主机 在 局 域 网 中 彼此 通信 时 ， 它 们 
的 通信 将 会 经 由 一 些 被 诸多 设备 所 共享 的 媒介 。 因 此 ， 在 局 域 网 中 的 设备 通信 就 必须 得 和 所 
有 其 他 连接 到 有 关 媒 介 的 设备 共享 访问 对 应 媒介 。 既 然 相 关 数 据 包 必 须 带 有 地 址 ， 故 而 就 可 
以 使 用 像 广播 或 组 播 之 类 的 特殊 地 址 。 最 后 一 点 ， 因 为 许多 主机 共享 了 单一 的 连接 ， 所 以 对 
硬件 来 说 就 有 必要 对 媒介 实施 访问 控制 。 

交换 (switching) 是 一 种 全 新 的 技术 ， 而 且 这 种 技术 使 局 域 网 和 广域网 之 间 的 区 别 变 得 
十 分 模糊 或 不 太 明 显 。 各 人 台 设 备 直接 连接 到 了 采用 诸如 以 太 网 技术 的 网 络 交换 机 的 端口 上 ， 
而 以 太 网 技术 原先 被 用 来 把 相关 设备 连接 到 局 域 网 上 。 然 而， 交换 机 读 取 数据 包 中 的 地 址 ， 
并 将 有 关 数 据 包 仅仅 转发 到 与 合适 的 设备 相连 接 的 端口 上 。 为 此 ， 与 交换 机 连接 的 设备 并 不 
会 像 先前 的 共享 访问 技术 那样 来 共享 媒介 ， 所 以 相关 连接 可 以 采用 全 双 工 模式 ， 而 且 只 要 在 
交换 机 的 处 理 能 力 范 围 之 内 ， 任 何 设备 都 能 够 以 网 络 全 速 进行 信息 传输 ， 同 时 大 多 数 设备 都 
能 够 处 理 所 有 它们 可 以 发 送 的 信息 。 然 而 ， 数 据 包 还 是 必须 得 包含 地 址 信息 ， 而 且 依 然 支持 
广播 方式 和 组 播 方 式 。 


15.2.3 ”拓扑 结构 


无 论 是 广域网 还 是 局 域 网 ， 都 存在 各 种 各 样 的 拓扑 结构 以 支持 诸多 设备 之 间 的 连接 。 在 
广域网 中 ,我 们 可 以 采用 如 下 的 任意 拓扑 结构 实现 主机 间 的 成 对 连接 : 
e 线形 网 络 (如 图 15-3 所 示 ) 
树 形 网 络 (如 图 15-4 所 示 ， 顶 层 结 点 是 焦点 ) 
星 形 网 络 (如 图 15-5 所 示 ， 中 心 结 点 是 焦点 ) 
环形 网 络 (如 图 15-6 所 示 ) 
部 分 互 连 的 网 状 网 络 ( 如 图 15:7 所 示 ) 
完全 互 连 的 网 状 网 络 (如 图 15-8 所 示 ) 





上 一 一 本 
图 15-3 ”线形 网 络 拓扑 结构 示例 图 15-4 树 形 网 络 拓扑 结构 示例 图 15-5 星 形 网 络 拓扑 结构 示例 


上 述 每 一 种 可 能 的 拓扑 结构 均 拥有 一 些 与 众 不 同 的 特点 。 首 先 ， 让 我 们 考虑 这 些 拓扑 结 
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构 用 于 广域网 时 的 情形 。 相 对 而 言 ， 两 台 设 备 之 间 的 每 条 广域网 连接 往往 较为 昂贵 。 进 一 步 
说 ， 线 形 网 络 、 树 形 网 络 和 星 形 网 络 拓扑 结构 (star topology) 的 成 本 最 为 低廉 ， 因 为 它们 的 
连接 数量 最 少 。 而 就 所 有 结 点 获取 信息 的 路 径 而 言 ， 线 形 网 络 拓扑 结构 (1linear topology) 的 
信息 获取 路 径 最 长 ， 所 以 相应 网 络 中 到 其 他 所 有 设备 的 通信 可 能 会 有 点 缓慢 。 当 所 有 的 网 络 
设备 都 试图 获取 某 种 集中 式 服务 时 ， 往 往 会 采用 树 形 网 络 拓扑 结构 ( hierarchical topology， 
或 tree topology)。 这 种 结构 在 大 型 机 时 代 非 常 典 型 。 环 形 网 络 拓扑 结构 (ring topology) 和 
网 状 网 络 拓扑 结构 (mesh topology) 则 比较 可 靠 (假设 有 关 通 信 可 以 在 某 个 环 上 双向 进行 )， 
因为 其 中 通常 存在 元 余 的 路 径 可 以 进行 通信 。 特 别 地 ， 在 环形 网 络 拓扑 结构 中 ， 唯 一 一 条 
连接 的 失败 并 不 会 导致 任何 主机 的 通信 失败 。 而 完全 互联 的 网 状 网 络 拓扑 结构 则 是 成 本 最 高 
的 ， 因 为 这 种 结构 拥有 非常 多 的 连接 。 但 同时 ， 相 关 拓 扑 结 构 也 是 最 快捷 的 ， 因 为 每 一 个 结 
点 和 其 他 任何 一 个 结 点 仅仅 相隔 一 条 连接 的 距离 。 而 且 ， 这 种 结构 也 是 最 为 可 靠 的 ， 因 为 
失去 一 条 连接 只 不 过 意味 着 失败 连接 两 端的 两 个 结 点 不 得 不 利用 一 个 中 间 结 点 来 进行 通信 而 
已 。 部 分 互联 的 网 状 网 络 拓扑 结构 则 是 一 种 折 中 方案 ， 故 而 相当 常见 ， 并 成 为 互联 网 所 实际 
采用 的 拓扑 结构 。 对 于 存在 元 余 路 径 的 网 络 来 说 ， 其 数据 链 路 层 和 网 络 层 往往 需要 较为 复杂 
的 路 由 决策 来 实施 数据 包 的 处 理 。 


图 15-6 ”环形 网 络 拓 图 15-7 部 分 互 连 的 网 状 图 15-8 ”完全 互 连 的 网 状 
扑 结构 示例 网 络 拓扑 结构 网 络 拓 扑 结 构 

在 局 域 网 中 ， 总 线 型 网 络 与 环形 网 络 是 最 常见 的 两 种 拓扑 形式 。 总 线 型 网 络 拓 扑 结 构 
( linear bus topology) 看 起 来 有 点 像 图 15-3 所 示 的 总 线 , 但 实际 上 是 采用 如 图 15-9 所 示 的 方 
式 来 进行 连接 的 。 在 图 15-3 中 ， 每 一 个 结 点 与 下 一 个 结 点 之 间 都 有 一 条 连接 ， 并 且 对 于 一 
端的 一 个 结 点 和 另 一 端的 一 个 结 点 进行 通信 时 ， 有 关 消 息 必 须 经 由 每 一 个 中 间 结 点 来 进行 转 
发 。 在 局 域 网 中 ， 采 用 的 则 是 总 线 型 网 络 拓扑 结构 ， 其 中 ,总 线 是 一 种 独立 的 介质 ， 且 每 个 
结 点 都 会 与 之 相连 接 。 为 了 使 两 端的 结 点 能 够 进行 通信 ， 它 们 仅仅 需要 访问 介质 ， 然 后 就 可 
以 直接 进行 信息 交换 。 从 技术 角度 而 言 ， 采 用 环形 网 络 拓扑 结构 的 局 域 网 的 的 确 确 是 把 消息 
在 主机 与 主机 之 间 实 质 性 地 进行 了 传递 ， 只 是 大 多 数 的 主机 并 不 会 处 理 消息 而 已 。 对 于 这 样 
的 局 域 网 而 言 ， 每 个 结 点 就 像 是 连接 到 了 非常 类 似 于 总 线 型 网 络 拓 扑 结构 的 环 上 ， 当 一 台 设 
备 想 要 向 男 一 台 主 机 发 送 一 条 消息 时 ， 其 仅仅 需要 等 待 轮 到 其 自己 而 把 消息 传输 到 环 上 。 接 
收 方 主机 将 会 读 取 对 应 消息 ， 而 相应 消息 未 曾 寻 址 的 主机 则 只 需要 把 消息 向 前 传送 。 

这 两 种 技术 存在 一 种 可 能 的 结合 方式 ， 进 一 步 说 ,物理 上 而 言 是 一 种 总 线 型 网 络 拓 扑 结 
构 ， 但 是 通过 传送 一 个 逻辑 令 牌 (logical token) 来 控制 对 介质 的 访问 ， 就 好 像 对 应 局 域 网 是 
环形 网 络 拓扑 结构 一 样 。 这 称 为 令 牌 传送 式 总 线 ， 具 体 存 在 两 种 此 类 的 协议 实例 。 其 一 是 附 
属 资源 计算 机 网 络 ( Attached Resource Computer NETwork，ARCNET) 协议 ， 曾 经 广泛 用 
于 小 型 网 络 ， 但 是 如 今 主 要 限定 在 一 些 特 殊 的 应 用 场合 ， 璧 如 汽车 内 部 。 另 一 种 是 802.4 协 
议 ， 主 要 限于 汽车 制造 产业 ， 迄 今 未 有 进一步 的 发 展 。 
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在 确定 局 域 网 的 拓扑 结构 时 ， 可 能 会 产生 一 丁点 的 困惑 。 一 个 环形 网 络 拓扑 结构 可 能 实 
际 上 会 连接 得 像 星 形 网 络 拓扑 结构 ， 如 图 15-10 所 示 。 位 于 图 示 中 心 的 方 框 是 一 个 中 央 连 接 
结 点 ， 而 有 关 媒 介 似 乎 是 从 每 个 结 点 连接 到 了 中 心 的 一 个 点 。 但 是 ,该 中 心 点 并 不 是 一 个 结 
点 ,并 且 信 号 实际 上 是 以 环形 方式 从 一 个 结 点 传递 到 了 另 一 个 结 点 9。 类 似 地 ， 总 线 型 网 络 
拓扑 结构 可 以 收缩 成 一 个 单一 的 集线器 ， 就 好 像 物理 的 星 形 网 络 拓扑 结构 或 者 树 形 网 络 拓扑 
结构 ， 但 是 ， 有 关 信 和 号 是 在 同一 时 间 广 播 到 整个 网 络 上 的 ， 所 以 相关 电气 连接 采用 总 线 型 网 
络 拓扑 结构 ， 而 不 是 树 形 网 络 拓扑 结构 或 者 星 形 网 络 拓扑 结构 。 从 这 种 意义 上 而 言 ， 所 有 的 
结 点 都 可 以 看 到 相应 信号 ， 但 是 并 不 需要 将 其 转发 到 另 一 个 结 点 。 


ah 和 bs 


图 15-9 总 线 型 网 络 拓扑 结构 图 15-10 采用 环形 网 络 拓扑 结构 的 局 域 网 


今天 ， 大 多 数 的 局 域 网 其 实 都 是 交换 网 。 青 次 地 ， 网 络 拓 扑 结 构 可 能 看 起 来 像 是 星 形 
网 络 拓扑 结构 ， 但 中 心 的 方 框 是 一 个 高 速 的 交换 机 ， 其 读 取 由 所 连接 的 设备 发 送 来 的 数据 
包 ， 并且 只 会 把 数据 包 发 送 给 相应 数据 包 所 寻 址 的 设备 。 通 常情 况 下 ， 交 换 机 能 够 一 次 性 地 
把 所 有 经 由 各 个 端口 发 送 给 它们 的 数据 流转 发 出 去 。 这 就 是 所 谓 的 线 速 ( wire speed)。 如 果 
交换 机 拥有 许多 端口 或 者 这 些 端 口 是 高 速 端口 ， 那 么 这 便 要 求 相应 交换 机 具有 相当 大 的 带宽 
(bandwidth)。 我 们 将 会 在 15.5 节 进 一 步 讨 论 局 域 网 与 交换 机 。 


15.3 ”应 用 层 协议 
15.3.1 应 用 层 

在 协议 栈 的 每 一 层 中 ， 每 台 与 网 络 连 接 的 设备 往往 会 包含 相应 的 一 个 实体 ， 且 该 实体 
与 另 一 网 络 设备 中 的 对 应 实体 进行 交互 。 在 应 用 层 中 ， 在 一 个 终端 系统 中 便 存在 一 个 实体 通 
过 网 络 与 一 个 服务 器 系统 上 的 另 一 个 终端 应 用 程序 进行 交互 。 例 如 ， 有 人 可 能 在 个 人 计算 机 
上 使 用 Telnet 客户 端 与 某 一 UNIX 共享 系统 上 的 Telnet 服务 器 进行 通信 。 每 个 应 用 程序 往 
往 会 使 用 一 种 特定 的 协议 ， 且 通常 是 为 相关 应 用 程序 专门 设计 的 协议 。 有 些 时 候 ， 它 们 也 会 
采用 一 种 为 服务 于 各 种 各 样 的 定制 式 应 用 程序 而 设计 的 通用 协议 。 在 本 节 中 ， 我 们 将 简要 地 
介绍 儿 种 应 用 层 的 协议 ， 其 中 许多 协议 已 经 被 广泛 使 用 并 且 分 配 了 端口 号 (port number) 以 
供 相应 的 服务 器 所 使 用 。 此 端口 号 是 提供 给 下 一 较 低 层级 即 传输 层 来 使 用 的 ， 用 于 确定 哪个 
应 用 程序 应 当 接收 一 条 传人 的 消息 。 试 想 一 部 运行 FTP 服务 器 的 系统 可 能 还 同时 运行 着 诸 
如 Telnet、www 等 其 他 服务 。 而 源 自 网 络 的 消息 是 随机 到 达 的 ， 所 以 每 一 层 均 需 要 在 报头 
中 包含 发 送 实体 应 用 于 相应 数据 包 的 某 些 信息 ， 以 确定 传人 的 数据 包 应 提交 给 下 一 更 高 层 
级 的 哪 一 个 实体 。 对 于 一 个 给 定 的 应 用 程序 而 言 ， 要 使 用 的 端口 号 可 能 是 一 个 标准 端口 的 





日 ”中 心 的 集线器 可 能 包含 一 个 结 点 以 方便 管理 和 数据 收集 ， 然 而 该 结 点 并 不 是 集线器 功能 的 组 成 部 分 。 
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端口 号 ， 即 由 互联 网 工程 任务 组 所 保留 和 仅 限 于 相关 应 用 所 使 用 的 端口 号 。 如 果 所 用 端口 
号 并 非 标准 端口 号 ， 那么 有 关 应 用 程序 可 以 使 用 端口 号 1024 或 者 比 1024 更 大 但 同时 小 于 
49151 的 数 作为 端口 号 。 数 值 大 于 49151 的 端口 号 通常 由 操作 系统 软件 动态 地 分 配给 客户 端 
来 使 用 。 

现在 ， 大 多 数 的 网 络 连 接 都 使 用 TCP/IP 协议 族 。 图 15-11 便 给 出 了 网 际 协议 层 所 采用 
的 报头 格式 ， 该 报头 记录 了 源 端口 号 、 目 标 端口 号 以 及 本 章 中 所 讨论 到 的 其 他 字段 。 









十 
9 
” 


01234567890123456789012345678901 











序列 编号 
确认 编号 
“| 俩 确 搓 复 同 区 
| 加 大 这 各 扣 窗口 大 小 
册 志 直 志 志 让 (接收 缓冲 的 大 小 ) 
位 位 入 | 位 | 但 位 ， 
校 验 和 紧急 指针 
-选项 字段 填充 字段 








数据 
图 15-11 传输 控制 协议 报头 格式 


15.3.2” 超 文 本 传输 协议 


超 文本 传输 协议 ( HyperText Transfer Protocol，HTTP) 是 用 来 在 万 维 网 ( World Wide 
Web,， WWW) 服务 器 和 浏览 器 之 间 进 行 消 息 交 换 的 协议 。 万 维 网 服务 器 的 标准 端口 号 
是 80。 超 文本 传输 协议 的 相关 消息 以 美国 信息 交换 标准 代码 ( American Standard Code for 
Information Interchange，ASCII) 方式 发 送 ， 所 以 很 容易 就 能 够 被 人 读 懂 ， 尽 管 通常 情况 下 
并 非 真 的 这 样 。 浏 览 器 发 送 的 每 条 消息 往往 以 诸如 GET PUT、POST 或 OPTIONS 等 一 些 
命令 中 的 某 条 命令 打头 。 而 服务 器 则 发 回 一 条 响应 消息 ， 其 中 包含 一 段 代码 用 来 给 出 关于 浏 
览 器 输入 的 结果 ， 如 果 涉 及 页 面 请 求 且 成 功 访问 ， 则 还 会 返回 所 请 求 的 页 面 元 素 。 当 浏览 
器 请 求 页 面 时 ， 将 会 建立 一 条 到 服务 器 的 连接 ， 并 利用 统一 资源 定位 符 ( Uniform Resource 
Locator，URL ) 请 求 相应 页 面 。 统 一 资源 定位 符 所 引用 的 页 面 由 服务 器 在 对 应 的 响应 消息 
中 返回 。 然 而 ， 大 多 数 的 页 面 往往 包含 不 止 几 行 而 是 好 多 行 的 文本 。 通 常情 况 下 ， 还 会 引用 
包含 在 页 面 中 的 图 片 等 其 他 元 素 ， 而 且 其 中 所 包含 的 每 项 元 素 必须 从 对 应 的 服务 器 寺 单 独 请 
求 。 在 早期 版 本 的 超 文本 传输 协议 中 ， 服 务 器 将 会 在 每 次 请 求 单个 元 素 后 断 开 连接 ， 因 此 ， 
如 果 完 成 对 应 页 面 需要 提取 诸多 元 素 ， 那 么 相应 浏览 器 可 以 选择 同时 打开 多 个 连接 。 在 后 来 
的 超 文本 传输 协议 版 本 中 ， 则 可 以 选择 不 立即 断 开 有 关连 接 ， 从 而 使 得 在 返回 初始 页 面 之 
后 ， 相 应 浏览 器 可 以 同时 发 出 另外 的 对 多 个 元 素 的 请 求 。 

虽然 超 文本 传输 协议 是 专门 为 从 服务 器 获取 网 页 而 设计 的 ， 但 其 也 被 用 在 了 其 他 的 一 些 

合 。 鉴于 人 们 对 万 维 网 的 访问 是 如 此 地 需要 和 渴望 ， 所 以 大 多 数 实施 防火 墙 机 制 来 保护 它 
们 的 网 络 免 受 危害 的 机 构 ， 往 往 允许 超 文 本 传输 协议 的 消息 通过 防火 墙 ， 并 准许 随意 地 建立 
到 80 号 端口 的 连接 。 为 此 ， 出 于 相关 支持 问题 最 小 化 的 考量 ， 超 文本 传输 协议 常常 还 被 用 
来 定制 分 布 式 应 用 程序 。 
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15.3.3 ”文件 传输 协议 


文件 传输 协议 (File Transfer Protocol，FTP) 是 另 一 种 常见 的 应 用 层 协 议 。 与 其 他 的 协 
议 不 同 ， 文 件 传 输 协 议 使 用 两 个 端口 而 不 是 一 个 端口 。20 号 端口 为 主 端口 ， 用 于 传输 数据 ， 
而 21 号 端口 也 由 文件 传输 协议 所 使 用 ， 不 过 仅仅 用 来 发 送 控制 信息 。 这 种 设计 人 允许 一 次 较 
大 的 数据 传输 过 程 被 中 断 ， 例 如 ， 在 某 个 用 户 突然 意识 到 当前 正在 下 载 的 非常 大 的 文件 并 不 
是 所 需要 的 文件 的 情况 下 。 文 件 传输 协议 的 男 一 个 不 同 寻 常 的 方面 是 ，FTP 不 仅 是 协议 的 名 
称 ， 同 时 还 是 使 用 这 一 协议 的 程序 的 名 称 。 对 应 程序 是 一 个 命令 行 实用 程序 ， 要 想 学 会 并 熟 
练 使 用 该 程序 并 不 是 一 件 容 易 的 事情 。 一 种 解决 方案 是 使 用 保存 好 的 脚本 来 运行 该 程序 ， 而 
另外 一 种 常见 的 解决 方案 则 是 把 该 协议 嵌入 一 个 对 用 户 更 加 友好 的 应 用 程序 中 。 现 在 有 许多 
图 形 化 用 户 界 面 的 实用 程序 包含 了 文件 传输 协议 ， 并 可 以 支持 文件 的 传输 。 当 统一 资源 定位 
符 是 以 ftp:// 而 不 是 http:/ 打头 时 ， 大 多 数 的 浏览 器 甚至 都 能 够 支持 和 使 用 文件 传输 协议 。 

虽然 文件 传输 协议 所 使 用 的 命令 是 严格 的 ASCII 码 消息 , 但是， 正在 传输 的 文件 则 可 
能 是 程序 ， 并 且 经 常 包含 有 二 进 制 数 据 。 因 此 ， 它 们 偶尔 也 可 能 包含 看 起 来 像 是 文件 传输 
协议 命令 的 字符 串 。 这 也 正 是 数据 传输 使 用 了 与 命令 通道 相 独 立 的 一 个 通道 的 另 一 种 原因 。 
FTP 程序 包括 传输 方式 设置 (二进制 方式 或 文本 方式 )， 以 便 其 可 以 传输 包含 任意 二 进 制 数 
据 的 程序 和 其 他 文件 。 


15.3.4 简单 邮件 传输 协议 、 邮 局 协议 及 互联 网 邮件 访问 协议 

简单 邮件 传输 协议 ( Simple Mail Transfer Protocol，SMTP ) 用 在 电子 邮件 应 用 程序 中 ， 
以 便 从 用 户 的 电子 邮件 客户 端 程序 发 送 电子 邮件 ， 并 将 电子 邮件 从 一 个 电子 邮件 服务 器 转 
发 到 另 一 个 电子 邮件 服务 器 。 很 有 意思 的 是 ， 电 子 邮 件 客户 端 使 用 了 另外 不 同 的 协议 来 从 
服务 器 提取 电子 邮件 ， 有 具体 通常 为 使 用 110 号 端口 的 第 三 版 邮局 协议 (Post Office Protocol 
version 3，POP3 ) 或 使 用 143 号 端口 的 交互 式 邮 件 访 问 协议 ( Interactive Mail Access Protocol， 
IMAP),( 译 者 注 : 现 已 改称 为 互联 网 邮件 访问 协议 ， 即 Internet Mail Access Protocol， 二 者 
均 简 记 作 IMAP)。 邮 局 协议 是 一 种 较 旧 的 协议 ， 虽 然 得 到 了 广泛 支持 ， 但 是 不 太 灵 活 。 互 
联网 邮件 访问 协议 要 更 新 一 些 且 更 为 灵活 ,但 是 尚未 得 到 电子 邮件 服务 器 的 广泛 支持 。 

所 有 的 邮件 传输 协议 均 使 用 纯粹 的 ASCII 命令 , 并且 最 初 都 是 为 了 仅仅 传输 文本 消息 
而 设计 的 。ASCI 是 7 位 代码 ， 而 现代 计算 机 通常 都 使 用 8 位 字 节 并 忽略 了 附加 位 。 一 段 时 
间 以 前 ， 相 关 需 求 却 变 得 日 渐 清 晰 ， 也 就 是 说 ， 人 们 希望 能 够 将 所 有 各 种 类 型 的 文件 ， 包 括 
音频 、 视 频 文件 以 及 二 进 制程 序 等 附加 到 电子 邮件 中 。 所 以 ， 对 于 这 些 附 件 来 说 ， 附 加 位 是 
不 能 被 忽略 的 。 为 此 ， 针 对 简单 邮件 传输 协议 进行 了 扩充 设计 以 方便 处 理 其 他 的 文件 类 型 。 
具体 而 言 ， 多 用 途 互 联网 邮件 扩充 协议 (Multipurpose Internet Mail Extension，MIME ) 对 
简单 邮件 传输 协议 形成 了 补充 ， 并 且 支 持 在 标准 简单 邮件 传输 协议 的 邮件 内 部 封装 非 文本 的 
信息 。 

出 于 传输 可 靠 性 的 考量 ， 所 有 这 些 应 用 层 协 议 在 传输 层 上 均 采 用 传输 控制 协议 。 而 
其 他 不 需要 额外 的 传输 控制 协议 可 靠 性 的 那些 应 用 程序 则 往往 采用 用 户 数 据 报 协议 ( User 
Datagram Protocol，UDP)。 特别 地 ， 多 媒体 应 用 程序 经 常 使 用 用 户 数据 报 协议 ， 因 为 它们 
不 像 传输 数据 的 应 用 程序 。 也 就 是 说 ， 流 式 的 多 媒体 应 用 程序 通常 不 需要 百分之百 准确 的 数 
据 传输 。 进 一 步 说 ， 如 果 相 关 声 音 流 未 被 高 度 压 缩 过 ， 那 么 声音 流 中 丢失 一 个 数据 包 往 往 是 
不 会 被 注意 到 的 。 还 有 ， 在 应 用 层 中 ， 这 些 程序 大 多 使 用 专 有 的 协议 而 不 是 互联 网 工程 任务 
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组 所 审 订 的 标准 协议 。 


15.4 ”传输 控制 协议 和 网 际 协 议 


应 用 层 协 议 由 传输 层 上 的 协议 所 实现 的 相关 实体 来 加 以 支持 。 也 就 是 在 几 年 以 前 ,在 
传输 层 还 有 许多 不 同 的 网 络 协议 组 合 ( 称 为 “套件 ”(suite) ) 。 然 而 ， 互 联网 的 巨大 成 功 却 改 
变 了 这 种 情形 。 除 了 少数 例外 情况 ， 所 有 的 足够 大 到 想 要 联网 的 计算 机 设施 往往 也 希望 连接 
到 互联 网 。 为 了 能 够 访问 互联 网 ， 它 们 必须 得 使 用 传输 控制 协议 和 网 际 协议 徐 。 当 然 ， 在 它 
们 自己 的 网 络 内 部 ， 它 们 也 可 以 使 用 其 他 的 协议 簇 。 例 如 ， 如 果 想 要 使 用 互联 网 数据 包 交 
换 ( Internet Packet eXchange，IPX) 协议 来 访问 Novell Netware 服务 器 ， 在 计算 机 上 除了 需 
要 加 载 传输 控制 协议 ， 另 外 还 需要 加 载 互联 网 包 交 换 协 议 ， 而 这 是 一 件 非 常 简单 的 事情 。 当 
然 ， 每 个 追加 的 协议 簇 同时 也 增加 了 复杂 性 ， 并 且 因 为 支持 多 个 选项 的 成 本 较 高 ， 所 以 管理 
系统 的 人 员 常 常 希望 尽量 避免 此 类 复杂 性 。 为 此 ， 他 们 对 系统 供应 商 施加 越 来 越 大 的 压力 以 
使 其 支持 传输 控制 协议 。 故 而 ， 几 乎 所 有 的 供应 商 现 在 都 支持 传输 控制 协议 和 网 际 协议 簇 。 
鉴于 传输 控制 协议 和 网 际 协议 簇 所 没有 提供 的 重要 服务 ， 其 他 协议 簇 往往 也 没有 提供 ， 所 以 
大 多 数 网 络 管理 人 员 已 经 弃 用 了 其 他 协议 。 于 是 ; 传输 控制 协议 和 网 际 协议 簇 便 开始 主导 网 
络 连接 领域 。 


15.4.1 ”传输 层 

在 传输 控制 协议 和 网 际 协议 艇 中 ， 网 际 协议 是 主要 的 网 络 层 协议 ， 而 传输 控制 协议 则 
是 传输 层 上 两 种 主要 的 协议 中 的 一 种 ， 用 户 数据 报 协议 〈User Datagram Protocol，UDP) 是 
另外 的 一 种 。 给 定 网 际 协议 网 络 层 的 一 个 地 址 ， 网 际 协议 将 会 尝试 向 对 应 地 址 传递 一 个 数据 
包 。 用 户 数据 报 协议 仅仅 是 把 这 项 功能 扩展 到 了 应 用 层 。 这 一 非常 有 限 的 功能 被 称 为 “不 可 
靠 的 数据 报 ”( unreliable datagram ) 。 在 这 里 ,“ 不 可 靠 ” 一 词 并 不 意味 着 可 能 会 失败 ， 而 只 
是 说 有 关 协 议 没 有 对 传递 做 出 任何 保证 而 已 。 在 许多 情况 下 ， 这 种 “尽力 而 为 ”(best effort) 
功能 特性 其 实 就 是 所 需要 或 所 期 望 的 一 切 。 如 果 有 关 应 用 程序 与 连接 的 另 一 端 上 相应 的 应 用 
程序 正在 交换 消息 ， 那 么 这 两 个 应 用 程序 往往 能 够 判定 是 否 发 生 了 某 种 差错 。 例 如 ， 大 多 数 
的 网 络 管理 工具 通常 基于 用 户 数据 报 协议 来 发 送 请 求 和 响应 。 如 果 有 关 管 理 器 在 预定 的 时 间 
内 没有 接收 到 特定 的 响应 ， 那 么 它 只 需要 重新 尝试 相应 操作 即 可 。 

相 比 之 下 ， 传 输 控 制 协议 则 提供 了 “面向 连接 的 可 靠 的 ”通信 。 给 定 一 个 网 际 协 议 地 址 
和 一 个 端口 号 之 后 ， 传 输 控 制 协议 层 将 会 尝试 联系 在 对 应 地 址 的 系统 上 的 相应 端口 地 址 处 所 
运行 的 实体 ， 并 与 该 实体 建立 一 个 连接 。 然 后 ， 它 将 会 把 数据 发 送 给 另 一 端的 实体 ， 同 时 接 
收 响应 和 将 之 转发 给 主 调 应 用 程序 ， 这 一 过 程 将 会 持续 进行 ， 直 到 应 用 层 实体 的 一 方 中 止 该 
连接 为 止 。 这 种 协议 采用 了 诸如 消息 编号 和 确认 等 各 种 各 样 的 机 制 ， 以 确保 有 关 数 据 仅 被 传 
递 一 次 ， 准 确 地 来 说 是 仅 有 一 次 被 传送 到 另 一 端 ， 并 且 是 以 这 些 数 据 被 发 送 的 顺序 来 进行 传 
递 的 。 另 外 ， 该 协议 还 采用 了 其 他 机 制 来 妥善 处 理由 于 网 络 拥塞 等 原因 所 造成 的 发 送 方 传递 
速度 太 快 (相对 于 接收 方 而 言 ) 的 问题 。 


15.4.2 网际 协议 寻 址 和 路 由 


如 前 所 述 ， 连 接 到 男 一 台 主 机 时 ， 要 求 主 叫 主机 应 当知 道 目标 主机 的 网 际 协 议 地 址 (IP 
address， 或 称 为 IP 地址 )。 网 际 协议 地 址 长 度 为 32 位 。 不 过 ， 当 它们 显示 在 人 们 面前 时 ， 


282 沪 五 部 分 网 络 、 分 硕 式 夭 统 及 颁 会 


通常 写成 所 谓 点 分 十 进 制 标记 ( dotted decimal notation) 的 特定 样式 。 这 种 样式 将 32 位 划分 
成 4 字 节 ， 并 把 每 个 字 节 显示 为 一 个 十 进 制 数 ， 且 彼此 之 间 以 句点 相 分 隔 。 因 此 ， 一 个 所 有 
各 位 均 为 1 的 地 址 往往 被 写成 255.255.255.255。 每 个 连接 到 互联 网 的 网 际 协 议 网 络 均 拥 有 
一 个 与 众 不 同 的 网 络 编号 。 在 该 网 络 编号 内 ， 对 应 网 络 的 管理 员 将 为 每 台 主 机 系统 分 配 一 个 
单独 的 地 址 。 根 据 网 际 协议 地 址 的 哪些 部 分 被 用 作 网 络 编号 以 及 哪些 部 分 被 用 作 主 机 地 址 ， 
网 际 协议 地 址 曾经 一 度 被 划分 为 若干 类 别 。 这 些 类 别 具 体 被 称 为 A 类 、B 类 和 C 类 地 址 。( 也 
有 用 于 特殊 目的 的 D 类 地 址 和 了 类 地 址 。) 1993 年 ， 这 种 机 制 被 一 种 称 为 无 类 别 域 间 路 由 
(Classless Inter Domain Routing，CIDR) 的 新 的 机 制 所 代替 ， 同 时 各 类 地 址 之 间 的 技术 区 别 大 
部 分 也 已 不 复 存在 ， 尽 管 人 们 经 常 还 会 将 一 个 特定 的 地 址 归 到 这 些 类 别 中 的 某 一 种 类 别 上 。 

一 类 称 为 路 由 器 (router) 的 设备 负责 把 网 际 协议 数据 包 从 源 设备 传 送 到 目标 设备 。 每 
台 路 由 器 将 会 查看 数据 包 中 的 网 际 协 议 地 址 ， 并 试图 确定 到 达 目 标 网 络 的 最 佳 路 径 。 因 此 ， 
路 由 器 是 根据 网 络 层 上 的 信息 来 做 出 把 每 个 输入 的 数据 包 发 送 到 什么 地 方 的 决定 的 。 故 而 ， 
我 们 有 时 会 说 ， 路 由 器 是 在 第 三 层 上 做 出 转发 的 决定 的 。 大 部 分 的 网 际 协 议 网 络 地 址 并 不 是 
按照 地 理 位 置 进行 分 配 的 ， 所 以 ,把 网 际 协议 网 络 连 接 到 一 起 的 路 由 器 需要 学 会 如 何 才能 找 
到 世界 上 的 任何 其 他 的 网 络 。 它 们 主要 通过 彼此 之 间 的 交流 来 获取 有 关 的 信息 。 它 们 使 用 各 
种 各 样 的 协议 来 进行 信息 的 交换 。 两 台 路 由 器 彼此 间 所 使 用 的 协议 取决 于 它们 之 间 的 包括 行 
政 关系 在 内 的 各 种 关系 。 有 好 多 这 样 的 协议 ， 根 据 相 应 的 基础 算法 可 以 被 划分 成 若干 分 组 。 
其 中 较 大 的 分 组 是 距离 矢量 算法 群 ， 具 体 包 括 路 由 信息 协议 (Routing Information Protocol， 
RIP)、 第 二 版 路 由 信息 协议 (Routing Information Protocol Version 2，RIP2 )、 内 部 网 关 路 由 协 
议 ( Interior Gateway Routing Protocol，IGRP)、 增 强 型 内 部 网 关 路 由 协议 ( Enhanced Interior 
Gateway Routing Protocol，EIGRP) 以 及 边界 网 关 协 议 (Border Gateway Protocol，BGP)。 而 
链 路 状态 (link state) 算法 群 中 当前 的 一 个 主要 代表 是 开放 式 最 短路 径 优先 协议 ( Open 
Shortest Path First, OSPF )。 

互联 网 中 的 路 由 器 往往 以 拥有 许多 元 余 链 路 的 非 完 全 网 状 拓扑 结构 相连 接 ， 这样， 一 条 
链 路 出 现 问题 时 通常 就 不 会 把 整个 网 络 分 割 成 若干 无 法 通信 的 片段 。 当 然 ， 链 路 故障 仍然 可 
能 导致 服务 质量 的 某 种 程度 的 下 降 或 退化 ， 因 为 链 路 故障 必然 会 使 网 络 的 某 些 部 分 不 得 不 承 
担 更 多 的 负载 。 在 早期 的 网 络 中 ， 术 语 网 关 (gateway) 曾经 被 用 来 指 代 我 们 现在 称 作 “路 由 
器 ”的 这 一 类 设备 。 当 在 任何 设备 上 配置 网 际 协 议 时 ， 往 往 还 可 能 见 到 这 一 术语 的 使 用 ， 特 
别 是 作为 短语 默认 网 关 (default gateway) 的 一 部 分 。 这 里 ， 该 名 称 本 来 是 用 来 指定 一 台 主 
机 在 不 知道 究竟 应 该 采取 什么 样 的 最 佳 路 径 来 实现 其 与 另 一 台 主 机 之 间 的 通信 的 情况 下 所 使 
用 的 本 地 路 由 器 。 确 切 地 讲 ， 现 在 应 当 使 用 短语 默认 路 由 ( default router) 。 而 术语 “网 关 ”， 
准确 地 来 说 ， 则 被 用 来 指 在 应 用 层 上 运行 的 两 个 代理 之 间 进 行 连接 的 服务 。 具体 而 言 ， 一 个 
不 错 的 例子 ， 如 用 来 连接 面向 大 型 机 的 电子 邮件 系统 (譬如 IBM 的 办 公 软 件 OfficeVision ) 
以 及 运行 简单 邮件 传输 协议 和 第 三 版 邮局 协议 的 TCP/IP 电子 邮件 系统 的 电子 邮件 网 关 。 

姓 庸 置疑， 每 台 网 络 设 备 都 可 以 按照 预先 确定 的 静态 的 网 际 协 议 地 址 实施 特定 的 配置 ， 
但 是 这 样 将 会 很 难 管理 。 当 然 ， 和 凭借 名 称 而 在 整个 互联 网 上 为 人 熟悉 的 各 台 服 务 器 往往 会 拥 
有 永久 性 的 已 分 配 的 地 址 。 然 而 对 于 其 他 的 情况 来 说 ， 采 取 动 态 分 配 地 址 的 方式 则 会 容易 许 
多 。 例 如 ， 计 算 机 经 常会 伴随 人 员 在 部 门 之 间 的 调动 而 搬 来 搬 去 。 而 笔记 本 电脑 则 使 得 有 
关 情 况 变 得 更 为 糟糕 ， 因 为 它们 常常 从 办 公 室 搬 到 了 家 里 甚至 进而 带 到 了 邻近 的 一 个 阅 区 。 
因此 ， 人 们 设计 了 一 种 协议 ， 即 动态 主机 配置 协议 (Dynamic Host Configuration Protocol， 
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DHCP) 来 方便 和 适应 这 种 移动 性 。 于 是 ， 每 个 网 络 管理 员 通常 会 搭建 一 台 动 态 主机 配置 协 
议 服务 器 ， 并 为 该 服务 器 配置 上 已 分 配给 相应 网 络 的 一 系列 网 际 协 议 地 址 。 一 台 刚 刚 打 开 的 
主机 将 会 发 出 寻找 动态 主机 配置 协议 服务 器 的 广播 消息 。 而 动态 主机 配置 协议 服务 器 将 会 回 
复 该 主机 ， 并 告诉 它 包 括 关 于 应 当 使 用 哪个 网 际 协议 地 址 在 内 的 各 种 需要 了 解 的 信息 。 相 应 
地 址 将 会 被 对 应 工作 站 租用 一 段 时 间 ， 之 后 则 必须 重新 进行 申请 。 不 过 ， 动 态 主机 配置 协议 
服务 器 也 可 以 配置 成 每 次 都 为 特定 的 计算 机 提供 相同 的 网 际 协 议 地 址 ， 但 是 这 通常 仅 适 用 于 
服务 器 、 打 印 机 以 及 其 他 的 一 般 情况 下 不 会 经 常 发 生变 化 的 有 关系 统 。 


15.4.3 名称 解 析 


鉴于 人 们 发 现 要 记 住 网 际 协 议 地 址 并 不 是 一 件 容易 的 事情 ， 所 以 ， 传 输 控制 协议 和 网 
际 协 议 簇 便 包 含 了 把 用 户 容易 掌握 使 用 的 名 称 转换 为 网 际 协议 地 址 的 相关 机 制 。 用 于 实施 这 
一 转换 的 协议 称 为 域名 服务 (Domain Name Service，DNS)。 域 名 服务 依赖 于 一 系列 按 层次 
结构 组 织 的 服务 器 来 完成 有 关 转 换 。 例 如 ， 一 台 主 机 可 能 使 用 了 域名 服务 器 ， 以 便 把 本 地 
网 络 上 的 名 称 “ webserv” 转 换 为 一 个 网 际 协议 地 址 。 如 果 有 关 用 户 位 于 相应 名 称 所 处 的 域 
(domain) 中 , 那么 域名 服务 器 就 可 能 会 返回 像 223.1.2.1 这 样 的 一 个 网 际 协 议 地 址 。 而 如 果 
有 关 用 户 位 于 相应 名 称 所 处 的 域 之 外 ， 那 么 要 尝试 找到 这 一 相同 的 服务 器 ， 就 必须 得 使 用 该 
名 称 的 另外 不 同 的 形式 ， 璧 如 webserv.example.com， 称 之 为 完全 限定 式 名 称 (fully qualified 
name)。 在 这 样 的 名 称 中 ， 句 点 之 间 的 每 个 部 分 被 称 为 域名 。 通 常情 况 下 ， 有 关 的 域名 被 组 
织 成 一 个 树 形 结 构 。 各 种 各 样 的 较 高 层级 的 域名 由 不 同 的 机 构 所 拥有 和 进行 管理 ， 而 项 级 域 
名 (Top Level Domain，TLD)， 在 前 面 的 例子 里 即 “ .com”， 则 在 互联 网 工程 任务 组 的 授权 
下 进行 管理 。 如 果 一 台 主 机 想 要 查找 这 样 的 完全 限定 名 称 ， 它 首先 得 向 其 默认 的 域名 服务 器 
发 出 请 求 。 而 相应 服务 器 的 网 际 协议 地 址 要 么 是 通过 动态 主机 配置 协议 获悉 的 ， 要 么 是 在 配 
置 网 际 协议 时 通过 手工 方式 配置 到 主机 中 的 。 如 果 对 应 的 本 地 域名 服务 器 并 不 知道 webserv. 
example.com 的 网 际 协议 地 址 ， 那 么 它 将 会 向 域名 服务 层次 结构 中 的 下 一 级 别 的 相应 服务 器 
发 出 请 求 。 以 此 类 推 。 最 终 ， 对 应 的 地 址 将 会 被 找到 并 返回 给 最 初 发 出 请 求 的 那 台 主 机 。 


15.4.4 第 6 版 网 际 协议 


到 20 世纪 90 年 代 初期 ， 全 世界 的 网 际 协议 地 址 似乎 很 快 就 将 用 完了 。 于 是 ， 这 便 极 大 
地 推动 了 对 新 版 的 传输 控制 协议 和 网 际 协议 簇 及 网 际 协议 地 址 的 定义 。 相 关 新 的 版 本 称 为 第 
6 版 网 际 协议 (IP version 6,IPv6 )。 其 中 , 第 6 版 网 际 协议 将 会 支持 非常 多 的 网 际 协议 地 址 ， 
进一步 说 ， 在 我 们 仍然 使 用 传输 控制 协议 和 网 际 协议 簇 的 情况 下 ， 我 们 将 几乎 不 可 能 用 完 相 
应 的 网 际 协议 地 址 。 与 此 同时 ， 若 干事 件 的 发 生 也 减缓 了 网 际 协议 地 址 相关 爆炸 性 的 增长 需 
求 。 首 先 ， 无 类 别 域 间 路 由 能 够 支持 对 许多 先前 曾经 分 配给 某 些 机 构 但 那些 机 构 不 再 需要 的 
网 际 协 议 地 址 进行 重新 利用 。 其 次 ， 在 有 关 主 机 经 常 长 时 间 地 处 于 关机 状态 或 者 定期 接 人 和 
离开 网 络 的 情况 下 ， 动 态 主机 配置 协议 便 可 以 支持 对 网 际 协议 地 址 的 动态 重用 ， 为 此 相关 机 
构 即 便 是 拥有 较 少 的 网 际 协 议 地 址 也 可 正常 应 对 网 络 连接 需求 。 最 后 一 点 ， 开 发 完成 了 网 络 
地 址 转换 ( Network Address Translation，NAT) 技术 。 网 络 地 址 转换 是 一 种 新 型 技术 ， 其 使 
用 网 络 内 的 一 组 地 址 ， 并 把 这 些 地 址 转换 成 为 在 互联 网 上 本 地 网 络 之 外 的 地 方 所 看 到 的 另外 
不 同 的 (甚至 更 少 的 ) 一 组 地 址 。 这 些 技术 汇合 起 来 ， 便 意味 着 升级 到 第 6 版 网 际 协议 的 压 
力 就 大 大 消除 了 。 尽 管 如 此 ， 考 虑 到 第 6 版 网 际 协议 的 其 他 方面 的 功能 ， 这 种 迁移 从 长 远 来 
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看 最 终 可 能 仍然 将 会 发 生 。 幸 运 的 是 ,第 6 版 网 际 协议 被 设计 为 支持 飘 选 得 体 的 迁移 方式 。 
总 的 来 说 ， 大 多 数 的 路 由 天 供应 商 已 经 支持 第 6 版 网 际 协议 ， 并 且 大 多 数 新 版 的 操作 系统 也 
包括 对 第 6 版 网 际 协 议 的 支持 ， 不 过 ， 似 乎 没有 很 多 用 户 要 迁移 到 第 6 版 网 际 协议 上 。 然 
而 ， 有 一 种 专门 使 用 第 6 版 网 际 协议 的 称 为 第 二 代 互联 网 ( Internet 2 ) 的 研究 性 网 络 正 处 于 
与 互联 网 同步 发 展 的 过 程 中 。 


15.4.5 ”公共 实用 例 程 


许多 实用 例 程 通常 和 传输 控制 协议 及 网 际 协 议 栈 一 起 结伴 分 布 ， 其 中 有 一 些 是 设计 用 来 
访问 公共 服务 的 ， 例 如 : | 

e 访问 超 文 本 传输 协议 服务 器 ( 即 万 维 网 服务 器 ) 的 浏览 器 。 

e 访问 文件 传输 协议 服务 器 的 ftp 客户 端 (有 时 也 由 浏览 器 来 完成 )。 

e 用 作 远 程 登 录 命 令 解 释 器 的 telnet。 

e 用 于 处 理 简单 邮件 传输 协议 、 第 三 版 邮局 协议 以 及 交互 式 邮 件 访问 协议 等 电子 邮件 

的 pine。 

另外 还 有 一 些 常见 的 分 布 式 实用 程序 是 为 网 络 管理 而 设计 开发 的 。 有 关 工 具 的 了 解 将 有 
利于 帮助 任何 系统 设计 人 员 理 解 本 地 网 络 的 操作 及 其 是 如 何 影 响 系 统 设计 的 。 这 些 工 具 将 会 
在 第 15.8 节 中 展开 进一步 的 讨论 。 


15.4.6 ”其 他 协议 


虽然 在 网 络 层 运行 的 其 他 协议 大 部 分 都 已 经 被 放弃 和 退出 历史 上 舞台 了 , 但 是 运行 
IBM 的 系统 网 络 体系 结构 ( System Network Architecture，SNA) 及 程序 与 程序 间 高 级 通信 
( Advanced Program-to-Program Communication，APPC) 协议 族 中 的 协议 的 系统 装机 量 仍 然 
十 分 可 观 。 其 中 一 些 协议 在 时 间 上 要 早 于 传输 控制 协议 和 网 际 协议 栈 。 某 些 运行 这 些 协议 
的 设备 是 不 可 编程 的 ， 并 且 不 能 轻易 升级 。 此 外 ， 这 些 协议 具有 一 些 特殊 的 功能 ， 使 得 它 
们 在 高 级 别 需 求 的 情况 下 比较 有 用 ， 因 此 它们 可 能 在 未 来 的 一 段 时 间 内 仍然 将 会 继续 使 用 。 
男 一 种 在 过 去 十 分 常见 的 协议 是 互联 网 数据 包 交 换 协 议 ( IPX)， 由 诺 勒 公司 ( Novell) 在 其 
Netware 服务 器 上 使 用 而 推广 开 来 。 互 联网 数据 包 交 换 协 议 拥 有 一 项 使 其 非常 受 欢迎 的 特 
征 ， 进 一 步 说 ， 介 质 访问 控制 (Media Access Control，MAC) 层 地 址 被 用 作 网 络 层 地 址 的 
一 部 分 ， 并 且 客 户 端 系统 可 以 自动 获知 对 应 地 址 的 剩余 部 分 。 这 意味 着 ， 即 使 相应 系统 迁移 
到 了 另外 一 个 物理 网 络 中 ， 客 户 端 工作 站 中 的 互联 网 数据 包 交 换 协议 的 驱动 程序 也 无 须 对 地 
址 进行 配置 。 这 便 大 大 简化 了 网 络 管理 ， 这 也 可 能 是 有 关 操 作 系统 得 以 流行 开 来 的 一 项 重要 
因素 。 然 而 ， 互 联网 的 普及 最 终 盖 过 了 这 项 优势 ， 从 而 导致 诺 勒 公司 最 终 抛弃 了 该 项 协议 。 
尽管 如 此 ， 互 联网 数据 包 交 换 协 议 已 经 在 线 上 多 人 网 络 游戏 中 找到 了 自己 的 合适 位 置 ， 故 而 
也 有 可 能 继续 会 伴随 我 们 存在 一 段 时 间 。 人 们 还 使 用 过 各 种 各 样 的 其 他 协议 ， 大 多 数 与 特定 
的 操作 系统 相关 。 有 关 实 例 包 括 在 数字 设备 公司 ( Digital Equipment Corporation，DEC ) 的 
硬件 上 使 用 的 数字 设备 公司 分 层 网 络 体系 结构 协议 (Digital Equipment Corporation Network， 
DECNet) 和 本 地 传输 (Local Area Transport，LAT) 协议 以 及 在 Banyan 系统 上 使 用 的 虚拟 
集成 网 络 服务 协议 ( Virtual Integrated Network Service，Vines)。 网 络 基本 输入 /输出 系统 
(NETwork Basic Input Output System，NetBIOS) 协议 最 初 是 为 TBM 公司 及 其 小 型 局 域 网 而 
开发 的 ， 但 该 协议 最 后 却 被 微软 公司 所 采纳 ， 并 且 只 是 在 后 来 发 行 的 高 版 本 的 Windows NT 
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中 才 开 始 走向 消亡 。 还 有 一 些 其 他 的 供应 商 也 已 经 被 收购 、 合 并 或 不 复 存 在 。 在 某 些 情况 
下 ， 由 IBM 公司 所 开发 并 且 由 微软 公司 所 广泛 使 用 的 网 络 基 本 输入 /输出 系统 协议 的 某 些 
残余 或 印迹 依然 存在 。 具 体 来 说 ， 其 中 就 包括 服务 器 消息 块 ( Server Message Block，SMB) 
协议 以 及 在 UNIX 和 Linux 操作 系统 中 用 来 访问 微软 服务 器 的 开源 Samba 软件 包 。 尽 管 如 
此 ， 最 新 发 布 的 Windows NT 系列 操作 系统 已 经 明确 表示 ， 传 输 控 制 协 议和 网 际 协议 簇 将 是 
它们 的 首选 方向 。 


15.4.7 防火墙 


遗憾 的 是 ， 这 个 世界 上 总 会 存在 一 些 缺 乏 相 应 知识 、 欠 缺 相关 技能 或 者 行为 图 谋 不 轨 
的 人 。 于 是 ,不 好 的 东西 便 可 能 进入 一 个 通过 互联 网 (或 任何 类 似 的 网 络 ) 而 暴露 在 整个 世 
界面 前 的 网 络 中 。 鉴 于 此 ， 人 们 已 经 设计 和 开发 出 了 相关 设备 来 保护 网 络 免 受 有 关 恶 意 信息 
的 影响 。 一 般 来 说 ， 这 些 设备 就 是 路 由 器 。 这 些 路 由 器 被 放置 在 从 互联 网 到 相应 网 络 的 入 口 
处 ， 并 像 平常 那样 接受 来 自 互联 网 的 各 种 数据 包 。 但是， 在 路 由 器 将 有 关 数 据 包 转发 到 网 络 
内 部 的 局 域 网 之 前 ， 它 们 将 会 执行 一 些 额 外 的 操作 功能 ， 仔 细 查 验 数 据 包 内 部 ， 从 而 确认 是 
否 存在 某 些 东西 是 相应 的 网 络 管理 员 已 经 设 定 不 想 让 其 通过 路 由 器 的 。 这 些 检查 可 以 包括 很 
多 方面 。 这 里 仅 举 几 个 代表 性 的 例子 (我 们 将 会 在 第 16 章 展开 具体 的 讨论 ): 

e “拼接 ”测试 (PING) 

e 垃圾 邮件 (SPAM email) 

e 病毒 (Viruse) 

e 已 知 的 拒绝 服务 攻击 (Denial of Service，DoS ) 

e 访问 不 受 欢迎 的 网 站 (例如 家 长 控制 ) 

e 访问 未 使 用 的 端口 


15.5 数据 链 路 层 


起 初 ， 被 称 为 局 域 网 的 网 络 类 型 具有 一 种 特殊 的 性 质 : 其 中 的 数据 以 一 种 特别 的 方式 进 
行 传输 ， 使 得 连接 到 相同 链 路 的 所 有 主机 实际 上 均 能 够 “看 到 ”每 一 传输 的 数据 流 。 通 常情 
况 下 ， 每 台 主 机 被 配置 成 为 仅仅 “ 读 取 ” 实 际 寻 址 到 其 自身 的 那些 信息 。 经 常 应 用 于 此 类 局 
域 网 的 男 一 种 说 法 是 “多 路 访问 网 络 ”(multiaccess network) 。 由 于 许多 这 样 的 主机 连接 到 一 
个 物理 介质 上 ， 所 以 必须 要 设计 一 种 机 制 来 支持 有 关 主 机 对 介质 的 共享 访问 。 相 关机 制 被 称 
为 介质 访问 控制 (Media Access Control，MAC)。 由 这 一 名 称 衍生 出 来 的 男 一 个 术语 则 是 介 
质 访问 控制 地 址 (MAC address)。 每 台 主 机 都 通过 一 个 网 络 接口 卡 (Network Interface Card， 
NIC ; 有 时 也 称 为 网 络 适 配器 ， 即 network adapter ; 简称 网 卡 ) 连接 到 局 域 网 上 。 每 个 网 卡 
都 拥有 一 个 由 相应 制造 商 所 分 配 的 6 字 节 地 址 ， 其 中 前 3 字 节 用 来 标识 制造 商 ， 而 后 3 字 节 
用 来 标识 对 应 特定 的 适配器 。 在 大 多 数 情 况 下 ， 我 们 可 以 放心 地 认为 这 些 地 址 在 全 世界 是 唯 
一 的 ， 尽 管 确 有 报道 声称 某 些 不 守 道 德 准则 的 不 良 供 应 商 在 假借 其 他 供应 商 的 标识 编号 进行 
网 卡 的 制造 。 

对 于 介质 访问 控制 功能 来 说 ， 同 样 也 存在 许多 不 同 的 相互 竞争 的 机 制 。 但 是 ， 其 中 
只 有 4 种 机 制 是 非常 成 功 的 ， 这 就 是 以 太 网 (Ethernet)、 附 属 资源 计算 机 网 络 ( Attached 
Resource Computer NETwork, ARCNET)、 令 牌 环 (token ring) 和 光纤 分 布 式 数据 接口 (Fiber 
Distributed Data Interface，FDDI)。 附 属 资源 计算 机 网 络 是 第 一 代 局 域 网 技术 之 一 ,但 是 其 
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具有 非常 大 的 局 限 性 。 然 而 ， 正 是 有 关 限 制约 束 转 变 成 为 其 在 从 人 式 系统 中 的 优势 ， 于 是 附 
属 资源 计算 机 网 络 技术 当前 仍然 还 在 此 类 场景 中 继续 发 挥 着 作用 ， 但 是 从 其 作为 一 种 一 般 
的 局 域 网 技术 来 说 ， 它 却 实 际 上 已 经 消失 了 。 以 太 网 和 令 牌 环 最 终 由 电子 电气 工程 师 协 会 
(Institute of Electrical and Electronic Engineer，IEEE) 分 别 审定 为 802.3 标准 和 802.5 标准 。 
而 光纤 分 布 式 数据 接口 则 成 为 美国 国家 标准 化 委员 会 (American National Standard Institute， 
ANSI) 确立 的 标准 。 尽 管 我 们 常常 会 简单 地 说 起 “以 太 网 ”， 但 其 实 这 并 不 非常 准确 或 正确 ， 
之 所 以 这 样 说 只 是 因为 这 种 叫 法 已 经 成 为 一 种 相当 普遍 的 惯例 而 已 。 以 太 网 具有 一 项 突出 的 
优点 ， 那 就 是 无 论 同 令 牌 环 还 是 光纤 分 布 式 数据 接口 相 比 ， 它 都 是 一 项 更 为 简单 的 技术 ， 故 
而 通常 更 容易 实现 正确 安装 并 且 也 更 为 便宜 。 当 然 ， 以 太 网 也 存在 一 系列 的 严重 的 缺陷 或 
不 足 。 


15.5.1 以 太 网 


以 太 网 建立 在 大 多 数 时 间 有 关 网 络 并 不 繁忙 的 前 提 条 件 之 下 。 如 果 网 络 比较 繁忙 ， 那 
么 发 送 方 就 会 等 待 ， 一 直 要 等 到 网 络 变 得 空 辣 ， 然 后 才 会 发 送 。 如 果 两 个 站 点 同时 开始 传 
送信 息 ， 那 么 它们 的 传送 将 会 相互 于 扰 ， 并 导致 冲突 (collision)。 以 太 网 的 介质 访问 控制 机 
制 被 称 为 载波 侦 听 多 路 访问 / 冲突 检测 ( Carrier Sense Multiple Access/Collision Detection ， 
CSMA/CD )。 这 一 机 制 会 引发 两 个 主要 问题 。 其 一 ， 有 关 带 宽 并 非 完 全 可 用 的 。 在 负载 繁 
重 的 网 络 中 ,吞吐 量 (throughput) 在 大 多 数 情况 下 往往 最 大 只 能 达到 40% 一 50% 的 利用 率 。 
其 二 ， 如 果 有 关 网 络 超过 这 一 限 值 ， 那 么 它 最 终 将 会 到 达 一 个 冲突 时 时 发 生 而 网 络 完全 停止 
数据 传输 的 状态 。 而 令 牌 环 和 光纤 分 布 式 数据 接口 则 不 会 遭受 这 些 问题 。 它 们 是 确定 性 的 ， 
而 不 像 以 太 网 那样 是 随机 性 的 。 当 一 台 设 备 添加 到 局 域 网 时 ， 单 台 主机 的 平均 响应 时 间 将 会 
以 一 个 可 预测 的 量 级 发 生 下 降 。 同 时 ， 每 个 站 点 往往 会 获得 均等 的 访问 机 会 ， 因 此 ， 很 容易 
就 可 以 让 局 域 网 运行 达到 非常 接近 于 100% 的 利用 率 。 诸 如 银行 、 医 院 和 警察 局 等 不 能 容忍 
故障 并 且 需 要 能 够 预测 响应 时 间 的 机 构 ， 通 常会 不 惜 花费 多 余 的 钱 来 使 用 令 牌 环 或 光纤 分 布 
式 数 据 接口 。 


15.5.2 ”桥接 与 交换 

为 支持 以 太 网 克服 上 面 提 到 的 有 关 问 题 ， 人 们 最 终 开 发 出 了 一 种 解决 方案 ， 具体 就 是 采 
用 交换 机 ( switch) 替换 掉 了 共享 式 接线 集中 器 ( shared wiring concentrator， 又 称 为 集线器 ， 
即 hub)。 集 线 器 是 一 种 简单 的 物理 层 设 备 ， 它 只 是 把 源 自 任何 一 个 端口 的 输入 信和 号 重复 输 
出 到 所 有 其 他 的 端口 上 。 而 交换 机 则 是 一 种 多 端口 设备 ， 其 只 会 把 一 个 数据 包 发 送 到 通 向 
对 应 指定 接收 设备 的 那个 端口 上 。 在 这 一 层级 上 所 使 用 的 地 址 是 网 卡 的 以 太 网 地 址 。 因 此 ， 
这 种 转发 决策 是 在 数据 链 路 层 〈 或 介质 访问 控制 层 ) 上 来 完成 的 ， 故 而 有 时 被 称 为 第 二 层 交 
换 (layer two switching)。 进 一 步 说 ， 此 类 交换 能 够 在 所 有 端口 上 同时 接受 和 转发 输入 (不 
过 会 受到 相应 的 交换 机 背 板 的 限制 )。 此 外 ， 新 方案 还 支持 对 应 连接 设备 以 全 双 工 模式 ( full 
duplex) 运行 ， 也 就 是 同时 发 送 和 接收 ， 并 以 10Mbps ( 兆 位 / 秒 ) 或 100Mbps 的 速度 运行 。 
事实 上 ， 新 型 装置 其 至 可 以 自动 感应 相关 交换 机 及 所 连接 设备 的 最 佳 运作 模式 ， 从 而 使 有 关 
安装 就 像 集线器 那样 简单 。 现 在 ， 廉 价 的 交换 机 通常 也 能 够 让 相应 端口 运行 在 千 兆 以 太 网 
(Gigabit Ethernet) 的 速度 级 别 上 。 相 关 一 系列 的 技术 革新 ， 使 得 以 太 网 从 最 高 吞吐 量 SMbps 
的 系统 ， 发 展 到 了 相当 普通 的 一 台 交 换 机 便 能 够 以 100Mbps 的 速度 提供 1Gbps ( 千 兆 位 / 秒 ) 
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的 吞吐 量 的 系统 。 对 于 更 大 更 昂贵 的 交换 机 ， 则 其 至 能 够 提供 更 高 的 性 能 。 

在 多 端口 交换 机 变 得 司空 见 惯 之 前 ， 当 时 称 为 网 桥 ( bridge) 的 小 型 交换 机 ， 曾 经 被 用 
来 把 大 型 的 局 域 网 划分 成 若干 小 的 网 段 。 把 网 络 划分 为 若干 更 小 的 网 段 将 可 以 允许 每 个 网 段 
上 的 设备 支持 更 好 的 吞吐 量 (throughput) 和 响应 时 间 ( response time)。 所 谓 网 桥 ， 就 是 最 
初 只 有 两 个 端口 的 设备 。 它 们 通过 读 取 与 其 相连 接 的 局 域 网 上 的 所 有 信息 流 ， 从 而 获悉 通过 
每 个 端口 可 以 到 达 的 介质 访问 控制 地 址 。 当 它们 看 到 一 个 端口 的 某 数 据 包 发 往 指定 地 址 的 某 
台 设 备 并 且 它 们 已 经 获知 通过 另 一 个 端口 能 够 到 达 相 应 设备 的 情况 下 ， 它 们 将 把 该 数据 包 从 
对 应 另 一 个 端口 转发 出 去 。 这 被 称 为 透明 网 桥 (transparent bridge) 或 学 习 型 网 桥 ( learning 
bridge)。 如 果 两 个 网 桥 在 两 个 局 域 网 之 间 采 用 并 行 的 方式 相连 接 (这 往往 是 期 望 中 要 做 的 事 
情 ， 因 为 这 样 将 会 提供 元 余 链 路 以 防备 出 现 某 个 网 桥 发 生 故 障 的 情况 )， 那 么 透明 网 桥 便 可 
能 会 出 现 一 个 问题 。 也 就 是 说 ， 有 关 网 桥 将 可 能 形成 一 个 环 路 ， 并且 有 关 数 据 包 沿 着 相应 环 
路 持续 不 断 地 进行 传输 。 鉴 于 此 ， 人 们 针对 透明 网 桥 开 发 出 了 一 项 功能 ， 即 允许 它们 以 并 行 
方式 进行 连接 (甚至 可 以 连接 形成 更 为 复杂 的 网 状 网 络 )， 但 却 不 再 构成 环 路 。 有 关 网 桥 彼 此 
之 间 相 互 协调 ， 并 且 通 过 不 在 所 选择 的 路 径 上 转发 数据 流 ， 从 而 形成 一 棵 生成 树 ( spanning 
tree)。 这 棵 生成 树 将 会 把 数据 转发 到 任何 地 方 然而 却 不 会 包含 任何 环 路 。 如 果 一 个 网 桥 (或 
一 个 端口 ) 出 现 了 故障 ， 那么 相关 网 桥 将 会 察觉 到 这 种 情况 并 且 会 形成 新 的 生成 树 。 这 种 解 
决 方案 的 最 大 问题 将 会 出 现在 某 些 连接 并 非 局 域 网 连接 而 是 广域网 连接 的 情况 下 。 因 为 ， 广 
域 网 的 连接 线路 相当 昂贵 (相对 于 其 他 网 络 的 成 本 而 言 )， 并 且 拥 有 一 个 把 广域网 的 路 径 切 
断 以 防止 形成 环 路 的 网 桥 是 非常 奢华 的 ， 一 般 很 少 有 人 能 够 承担 得 起 。 

当 多 端口 交换 机 刚刚 上 市 的 时 候 ， 它 们 通常 就 可 以 把 来 自 所 有 输入 端口 的 信息 流 快 速 地 
转发 到 输出 端口 ， 就 像 由 所 连接 的 主机 发 送 的 速度 一 样 迅捷 。 这 被 称 为 线 速 (wire speed) 转 
发 。 有 关 营 销 人 员 硕 望 把 这 种 行为 同 早期 的 网 桥 区 分 开 来 ， 所 以 他 们 采用 了 交换 机 (switch ) 
这 个 词 。 鉴 于 其 出 色 的 性 能 ， 多 端口 交换 机 开始 切 人 和 瓜分 路 由 器 的 市 场 。 通 过 采用 专用 型 
集成 电路 ( Application-Specific Integrated Circuit，ASIC) 和 重新 设计 路 由 器 ， 工 程 师 便 构 
造 出 了 能 够 在 网 络 层 完成 转发 决策 但 却 可 以 像 第 二 层 交 换 机 那样 以 线 速 快捷 运作 的 设备 。 于 
是 ， 有 关 营 销 人 员 再 次 介入 ， 他 们 把 这 些 新 型 的 高 速 路 由 器 称 为 第 三 层 交 换 机 ( layer three 


Switch ) 。 


15.5.3 ” 令 牌 环 


令 牌 环 硬件 具有 一 套 与 以 太 网 完全 不 同 的 介质 访问 控制 机 制 。 有 关 硬 件 采 用 一 种 称 为 令 
牌 (token) 的 特殊 的 空 的 数据 包 ， 该 令 牌 持续 不 断 地 在 主机 之 间 进 行 传递 ， 直 到 它 到 达 一 台 
需要 传输 数据 帧 的 主机 。 此 时 ， 对 应 主机 将 会 把 该 令 牌 更 改 为 一 个 数据 帧 ， 进 而 把 它 发 送出 
去 。 虽 然 这 似乎 有 些 效率 低下 ， 但 实际 上 效果 却 很 好 。 如 前 所 述 ， 令 牌 环 硬件 可 以 轻松 达到 
98% 的 带宽 利用 率 。 相 比 之 下 ， 共 享 式 以 太 网 很 少 能 够 达到 60% 的 带宽 利用 率 ， 并 且 通 常 
甚至 要 低 不 少 。 

令 牌 环 网 桥 可 以 采用 与 以 太 网 网 桥 相同 的 方式 运作 ,但 是 它们 还 支持 一 种 被 称 为 源 路 由 
桥接 ( source route bridging) 的 更 复杂 的 模式 。 在 这 种 模式 下 ， 连 接 网 络 的 有 关 主 机 将 会 通 
过 网 桥 获知 路 径 ， 并 且 每 个 数据 包 都 将 包含 此 路 由 信息 。 这 种 方案 具有 如 下 几 个 优点 : 

e 网 桥 无 须 了 解 地 址 ， 并 且 更 简单 、 更 低廉 。 

e 网 桥 可 以 按 网 状 方式 进行 连接 ， 故 而 可 以 利用 所 有 链 路 。 
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e 跨 元 余 链 路 的 负载 往往 会 实现 自我 平衡 。 

但 遗憾 的 是 ， 源 路 由 相关 功能 要 求 得 实施 某 些 配置 (相对 于 透明 网 桥 来 说 ， 后 者 基本 上 
不 需要 任何 配置 )。 同 时 ,它们 是 利用 广播 方式 来 寻找 首选 路 由 的 ， 故 而 经 常会 被 指控 造成 
了 广播 风暴 ( broadcast storm)。 当 以 太 网 通过 利用 快速 交换 技术 克服 了 自身 问题 之 后 ， 令 牌 
环 选项 连同 源 路 由 桥接 技术 便 一 同 败 下 阵 来 。 


15.5.4 其 他 的 数据 链 路 方法 


光纤 分 布 式 数 据 接口 是 一 种 最 初 开发 来 用 于 光纤 而 不 是 铜 线 的 技术 。 所 以 ， 从 本 质 上 
讲 ， 相 关 构 建 和 安装 的 成 本 比较 昂贵 。 当 时 ， 光 纤 分 布 式 数据 接口 的 运行 速度 便 已 达到 了 
100 Mbps， 这 要 远 远 早 于 快速 以 太 网 能 够 达到 这 一 速度 之 前 。 同 时 ， 光 纤 分 布 式 数据 接口 环 
的 周 长 可 以 超过 200 千 米 。 不 过 ， 考 虑 到 成 本 因素 ， 光 纤 分 布 式 数据 接口 通常 不 用 于 各 人 台 主 
机 的 连接 ， 而 只 用 于 主干 (backbone) 局 域 网 实现 一 个 大 院 中 建筑 物 之 间 的 网 桥 、 交 换 机 或 
路 由 器 的 连接 。 后 来 经 过 修改 ， 光 纤 分 布 式 数据 接口 也 可 以 运行 在 较 短 距离 的 铜 线 上 。 

还 有 许多 其 他 的 技术 也 参与 了 局 域 网 领域 的 竞争 。 其 中 获得 有 限 成 功 的 一 项 技术 是 异步 
传输 模式 ( Asynchronous Transfer Mode，ATM)。 就 像 令 牌 环 一 样 ， 异 步 传输 模式 是 一 种 相 
当 复杂 的 技术 。 然 而 ， 异 步 传输 模式 提供 的 功能 使 得 其 在 某 些 场合 颇具 吸引 力 ， 比 如 说 希望 
在 单一 网 络 上 把 数据 传输 及 语音 和 视频 传输 混合 进行 并 且 要 向 所 有 用 户 保证 最 合适 的 服务 质 
量 (Quality of Service，QoS ) 的 情况 下 。 显 然 ， 异 步 传输 模式 在 广域网 领域 一 直 是 赢家 。 在 
局 域 网 领域 中 ， 提 供 不 同 服务 质量 要 求 的 服务 的 目标 是 通过 网 络 的 过 度 建 设 来 实现 的 ， 故 而 
任何 应 用 都 可 以 拥有 其 所 想 要 的 任何 服务 。 因 为 当前 的 带宽 成 本 非常 低 ， 所 以 这 是 可 能 的 。 
如 果 使 用 异步 传输 模式 来 进行 端 到 端的 通信 ， 将 会 实现 最 佳 的 总 体 性 能 。 在 利用 异步 传输 模 
式 的 地 方 ， 其 成 功率 还 是 很 高 的 。 在 这 一 点 上 ， 蜡 步 传输 模式 是 否 会 成 为 局 域 网 领域 的 一 个 
主要 因素 尚 不 确定 。 

附属 资源 计算 机 网 络 也 曾经 非常 流行 。 它 是 美国 国家 标准 化 委员 会 的 一 项 标准 ， 但 不 
是 电子 电气 工程 师 协 会 的 标准 ， 并 且 已 退出 历史 舞台 。 其 失势 的 主要 原因 在 于 ， 它 不 支持 桥 
接 ， 同 时 ， 它 拥有 一 个 网 络 层 地 址 ， 该 地 址 只 有 一 个 字 节 ， 由 硬件 交换 机 进行 配置 而 且 相 关 
配置 过 程 非 常 容 易 出 错 。 


15.5.5” 网 际 协议 地 址 到 介质 访问 控制 地 址 的 映射 


我 们 之 前 曾经 提 到 ， 人 们 往往 引用 的 是 像 webserv.example.com 之 类 的 便于 人 们 记忆 和 
使 用 的 名 称 ， 并 且 网 络 层 采用 了 域名 服务 来 把 对 应 的 名 称 转换 为 一 个 网 际 协 议 地 址 。 我 们 还 
曾 说 过 ， 在 局 域 网 上 ， 信 息 实际 上 是 通过 指定 介质 访问 控制 地 址 来 进行 发 送 的 。 那 么 ， 一 个 
显而易见 的 问题 就 是 ， 有 关 软 件 是 如 何 把 网 际 协议 地 址 映射 到 相应 的 介质 访问 控制 地 址 的 ? 
而 答案 是 ， 这 里 使 用 了 一 种 称 为 地 址 解析 协议 (Address Resolution Protocol，ARP) 的 特殊 
协议 。 正 在 查找 服务 器 的 一 台 主 机 往往 会 生成 一 个 包含 主机 和 服务 器 的 网 际 协议 地 址 的 地 址 
解析 协议 数据 包 。 同 时 ， 在 其 介质 访问 控制 报头 中 ， 将 会 包括 对 应 主机 自身 的 介质 访问 控制 
地 址 。 但 是 ， 因 为 有 关 主 机 尚 不 知道 相应 服务 器 的 介质 访问 控制 地 址 ， 所 以 该 主机 将 会 利用 
一 个 广播 式 介 质 访问 控制 地 址 ( 即 所 有 各 位 均 为 1 的 地 址 ) 把 对 应 数据 包 发 送 给 所 有 主机 。 
每 台 主 机 将 会 读 取 该 数据 包 ， 然 后 把 其 传递 给 网 际 协 议 软 件 。 而 网 际 协议 模块 将 会 把 该 数据 
包 进 一 步 传 递 给 地 址 解析 协议 模块 。 指 定 的 网 际 协 议 地 址 所 对 应 的 服务 器 中 的 地 址 解析 协议 
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模块 将 会 识别 出 有 关 主 机 正在 通过 地 址 解析 协议 进行 寻 址 定位 ， 从 而 会 准备 一 个 响应 地 址 解 
析 协 议 的 数据 包 。 这 个 数据 包 将 被 直接 发 送 回 对 应 正在 查询 的 主机 ， 于 是 ， 接 下 来 该 主机 就 
可 以 采用 相应 的 介质 访问 控制 地 址 继续 以 后 的 会 话 过 程 。 这 时 ， 除 了 被 指定 的 主机 ， 所 有 其 
他 主机 中 的 网 际 协议 软件 将 会 忽略 相应 的 数据 包 。 此 外 , 在 一 般 情 况 下 ， 有 关 操 作 系统 通常 
会 将 相关 的 介质 访问 控制 地 址 缓存 到 一 张 地 址 解析 协议 表 (arp table) 中 。 


15.5.6 面向 硬件 的 功能 迁移 


伴随 网 络 的 日 渐 成 熟 ， 某 些 最 初 由 设备 驱动 程序 在 软件 中 所 完成 的 功能 已 经 被 迁移 到 了 
相应 的 硬件 中 。 这 一 演化 步骤 往往 会 需要 一 些 时 日 ， 因 为 一 项 功能 在 被 完全 搞 清楚 之 前 ， 是 
不 应 当 被 迁移 到 硬件 中 的 ， 毕 竞 硬 件 错 误 的 修复 成 本 是 相当 昂贵 的 。 进 一 步 来 说 ， 在 网 卡 
中 ， 有 两 个 对 应 功能 被 迁移 到 硬件 的 例子 。 其 一 是 循环 宛 余 校 验 ( Cyclic Redundancy Check， 
CRC， 或 称 为 纵向 宛 余 校 验 码 ) 的 计算 。 循 环 元 余 校 验 是 针对 通过 网 络 传输 的 数据 块 进行 计 
算 的 一 类 功能 ， 具 体 在 第 14 章 中 展开 了 较为 详尽 的 讨论 。 循 环 宛 余 校 验 结果 往往 与 对 应 数 
据 块 一 起 进行 传输 ， 并 且 接 收 方 将 会 完成 与 发 送 方 相同 的 计算 。 如 果 接 收 方 所 计算 出 来 的 循 
环 元 余 校 验 结果 与 伴随 相应 数据 包 一 起 发 送 过 来 的 循环 元 余 校 验 结果 不 相 匹配 ,那么 接收 方 
就 可 以 获悉 其 间 发 生 了 一 个 错误 。 原 先 这 项 功能 是 由 有 关 网 卡 的 软件 驱动 程序 来 计算 完成 
的 。 从 处 理 器 周期 利用 角度 来 说 ， 有 关 计 算 成 本 还 是 相当 昂贵 的 。 然 而 ， 硬 件 工程 师 发 现 了 
一 种 相当 普通 的 在 数据 包 传输 时 来 完成 同样 计算 的 途径 。 这 是 一 种 非常 低廉 的 方法 ， 可 以 为 
处 理 器 减轻 相当 大 的 负载 。 尽 管 这 项 功能 对 于 现代 机 器 而 言 可 能 不 会 产生 多 大 的 区 别 和 效 
果 ， 但 在 该 项 功能 开发 时 ， 有 关机 器 运行 速度 非常 缓慢 ， 故 而 不 失 为 一 种 合算 的 解决 方案 。 

多 播 地 址 (multicast address) 的 识别 是 迁移 到 网 卡 硬 件 的 另 一 项 功能 。 一 般 来 说 ， 多 播 
数据 包 在 整个 网 络 中 进行 传输 ， 并 且 每 块 网 卡 都 会 看 到 它们 。 在 任何 一 个 时 间 ， 在 给 定 的 局 
域 网 上 都 可 能 有 多 条 多 播 数据 流 在 被 使 用 。 而 特定 的 系统 可 能 会 对 特定 的 数据 流感 兴趣 ， 也 
可 能 不 感 兴 趣 。 关 于 多 播 的 一 个 很 好 的 例子 是 股票 报价 应 用 程序 ， 该 程序 通常 可 能 在 股票 经 
纪 业 中 运行 。 尽 管 并 非 所 有 的 系统 都 需要 查看 相应 的 股票 行情 数据 流 ， 然 而 许多 经 纪 人 可 能 
想 要 查看 股票 报价 ， 因 此 他 们 将 会 运行 一 个 特定 的 应 用 程序 ， 以 查看 那些 分 配给 对 应 数据 流 
的 特定 的 多 播 地 址 。 曾 经 有 一 段 时 间 ， 所 有 的 多 播 数 据 流 都 会 被 所 有 的 网 络 适配器 所 接收 
到 ， 并 将 其 向 上 传递 给 网 络 层 。 在 那里 ， 如 果 系 统 判定 对 相应 的 数据 流 不 感 兴趣 ， 那 么 它们 
可 以 被 丢弃 掉 。 显 然 ， 这 对 于 那些 针对 任何 数据 流 都 不 感 兴趣 的 系统 来 说 尤其 是 徒劳 的 ， 因 
为 它们 也 会 被 每 个 多 播 数据 包 所 中 断 ， 并 且 有 关 软 件 还 必须 得 检查 数据 包 中 的 地 址 。 鉴 于 
此 ， 这 项 功能 最 后 也 被 迁移 到 了 网 卡 上 。 有 关 协 议 栈 ( protocol stack) 将 会 把 任何 使 应 用 程 
序 感 兴 趣 的 多 播 地 址 通知 给 对 应 的 网 卡 。 于 是 ， 发 给 这 些 地 址 的 数据 包 将 会 被 传递 到 协议 
栈 ， 而 任何 其 他 的 多 播 数 据 包 将 会 直接 被 对 应 的 网 卡 丢 弃 掉 ， 这 样 对 应 的 处 理 器 也 不 会 再 被 
中 断 了 。 


15.6 广域网 


与 局 域 网 中 的 主机 通常 放置 在 同一 栋 建筑 物 或 至 少 是 在 同一 大 院 中 的 情况 不 同 ， 广 域 
网 是 有 关 数 据 必 须 经 由 串 行 的 点 对 点 的 连接 进行 传输 的 设备 之 间 的 连接 。 这 些 连 接 常常 是 
在 两 部 网 桥 或 路 由 器 之 间 ， 但 有 时 也 会 是 一 台 主 机 连接 到 一 部 网 桥 或 路 由 器 上 ， 特 别 是 当 
对 应 连接 是 拨号 链 路 〈 或 称 为 拨号 连接 ) 的 情况 下 。 对 于 经 由 普通 老式 电话 服务 (Plain Old 
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Telephone Service，POTS ) 的 拨号 链 路 而 言 ， 最 高 可 用 速率 为 56 Kbps ( 千 位 / 秒 )。 当 一 条 
广域网 链 路 是 永久 性 的 连接 的 情况 下 ， 该 链 路 被 称 为 专用 线路 (又 称 为 租用 线路 )。 这 些 线 
路 往往 是 数字 信和 号 的 〈 而 不 像 拨号 链 路 ， 后 者 是 模拟 信号 的 )。 通 常情 况 下 ， 最 慢 的 专用 线 
路 的 速度 是 S6Kbps， 但 是 64Kbps 也 很 常见 。TI 线路 是 现 有 的 另 一 速度 的 线路 ， 以 1.544 
Mbps 的 速率 运行 。 有 时 ， 也 会 有 一 些 线路 提供 的 速度 在 64Kbps 和 TI1 之 间 ， 它 们 被 称 为 
次 T1 线路 (fractional Tl lines，Frac-T1 )。 另 外 ， 还 有 一 些 更 高 速度 的 线路 ， 它 们 的 速度 是 
T1 速度 的 数 倍 。T1 线路 最 初 是 为 承载 语音 业务 而 设计 的 ， 有 关 呼 叫 是 已 被 数字 化 为 64Kbps 
信息 流 的 模拟 信和 号。 通过 同步 时 分 多 路 复 用 (Time Division Multiplexing，TDM) 技术 ， 多 达 
24 条 这 样 的 慢 速 数字 信息 流 可 以 组 合 到 一 条 在 电话 公司 交换 中 心 之 间 运 营 的 TI 线路 上 。 


15.6.1 帧 中 继 
当 使 用 广域网 线路 构建 大 型 网 络 时 ， 线 路 总 成 本 的 一 个 重要 因素 是 从 客户 驻地 到 当地 
电话 公司 办 公 如 果 相 应 客户 拥有 多 条 租用 的 





56Kbps 的 线路 从 家 庭 办 公 室 连接 到 了 不 同 的 站 点 ， 那 么 他 们 通常 可 以 把 这 些 线路 按 24 条 一 
组 的 方式 多 路 复 用 到 单条 T1 线路 上 。 鉴 于 T1 线 路 往往 可 以 运行 在 一 条 标准 的 双 绞 线 铜 线 
上 ， 所 以 这 样 将 会 节省 大 量 的 线路 成 本 。 人 们 甚至 还 开发 出 来 了 另外 一 种 技术 ， 在 这 个 方向 
上 更 前 进 了 一 步 。 具 体 而 言 ， 有 关 线 路 没有 采用 上 面 所 描述 的 同步 时 分 多 路 复 用 技术 ， 即 不 
是 发 送 数据 流 而 是 发 送 数据 包 ， 同 时 每 个 数据 包 在 通过 网 络 时 单独 寻 址 和 进行 交换 。 这 种 技 
术 被 称 为 帧 中 继 ( frame relay)。 因 为 一 些 单独 的 56Kbps 的 电路 的 容量 常常 没有 得 到 充分 的 
利用 ， 所 以 这 样 做 是 非常 有 意义 的 。 利 用 同步 的 时 分 多 路 复 用 电路 的 网 络 一 般 被 设计 成 是 针 
对 接近 负载 业务 峰值 速率 时 的 情况 。 然 而 ， 由 于 最 坏 的 情况 往往 不 会 经 常 出 现 ， 所 以 通常 总 
会 存在 未 被 使 用 的 带宽 。 为 此 ， 当 采用 帧 中 继 技术 而 不 是 时 分 多 路 复 用 技术 时 ， 一 条 TI 线 
路 实际 上 可 以 承载 40 一 50 条 以 56Kbps 的 速率 运行 的 线路 上 的 所 有 的 数据 包 。 或 者 ， 单 一 
的 到 运营 商 办 公 室 的 56Kbps 的 帧 中 继 电 路 可 以 承载 3 一 5 条 并 非 总 是 大 量 使 用 的 56Kbps 的 
电路 上 的 所 有 帧 。 无 论 哪 一 种 方案 ， 帧 中 继 网 络 都 可 以 为 他 们 的 用 户 节省 大 量 的 钱财 。 


15.6.2 ”其 他 广域网 技术 


一 种 曾经 风靡 一 时 的 局 域 网 协议 是 综合 业务 数字 网 络 ( Integrated Services for Digital 
Network, ISDN) 协议 。 一 根 铜 线 电路 可 以 引 到 家 庭 或 小 型 办 公 室 ， 且 可 以 承载 两 个 64Kbps 
的 信道 8S。 这 种 类 型 的 服务 被 称 为 基本 速率 接口 (Basic Rate Interface，BRI)。 这 些 信道 可 以 
各 自 承 载 单 个 数字 化 语音 呼叫 或 一 个 数据 信道 。 人 
从 而 用 作 一 个 128Kbps 的 信道 。 这 实质 上 要 比 普通 老式 电话 服务 的 线路 更 好 。 关 于 综合 
务 数字 网 络 的 一 个 巨大 吸引 力 来 自 于 网 络 的 核心 ， 对 应 接口 是 一 个 主 速率 接口 (Primary 
Rate Interface，PRI)， 其 可 以 承载 23 个 64Kbps 的 信道 再 加 上 一 个 用 于 信 令 的 64Kbps 的 信 
道 。 主 速率 接口 的 主要 优点 在 于 ， 有 关 呼 叫 可 以 是 源 自 综合 业务 数字 网 络 的 基本 速率 接口 设 


” 备 的 数字 信号 呼叫 ， 也 可 以 是 源 自 常规 的 调制 解 调 器 的 模拟 信号 呼叫 。 其 间 ， 模 拟 信号 呼叫 


将 由 相应 运营 商 在 其 办 公 室 进 行 数字 化 处 理 后 并 以 数字 方式 进行 传送 。 今 天 ， 在 电话 支持 办 
公 室 中 仍然 使 用 综合 业务 数字 网 络 的 主 速率 接口 服务 提供 纯 语 音 的 传输 业务 。 
正如 前 面 所 提 到 的 ， 异步 传输 模式 是 男 一 种 专门 为 广域网 而 开发 的 技术 。 异 步 传输 模 


日 ”从 技术 上 讲 , 还 有 一 种 16Kbps 的 信道 ， 主 要 用 于 网 络 信 令 或 诸如 信用 卡 授权 等 低速 类 应 用 程序 - 
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式 就 是 被 运用 到 极致 的 帧 中 继 技术 。 进 一 步 说 ， 异 步 传输 模式 的 本 质 在 于 ， 所 有 的 信息 流 都 
被 划分 成 小 碎片 ， 即 48 字 节 的 信 元 (cell)。 这 些 信 元 可 以 快速 地 、 低 成 本 地 进行 切换 ， 并 
且 可 以 准确 地 为 每 个 用 户 提供 其 所 需要 的 传输 业务 服务 类 型 。 而 这 正 是 相关 运营 商 非常 期 户 
的 ， 因 为 他 们 拥有 一 系列 提供 从 电 传 业务 到 超 高 速 数 据 电路 等 各 种 不 同 服务 类 型 的 合同 。 利 
用 异步 传输 模式 ， 他 们 实际 上 只 需要 部 署 一 套 网 络 ， 而 只 是 在 网 络 的 入 口 和 出 口 位 置 使 用 不 
同 的 设备 ， 并 使 其 看 起 来 就 像 用 户 签约 的 服务 那样 即 可 。 有 关 运 营 商 只 需要 培训 操作 人 员 和 
技术 人 员 维 护 一 套 网 络 ， 他 们 仅仅 需要 一 类 管理 软件 ， 以 此 类 推 。 为 此 ， 不 难看 出 为 什么 许 
多 广域网 的 主干 网 络 已 经 采用 了 异步 传输 模式 。 

对 于 家 庭 和 小 型 企业 而 言 ， 还 有 两 种 参与 竞争 的 用 于 高 速 广域网 服务 的 其 他 技术 ， 即 有 
线 电视 网 络 调制 解 调 器 ( cable modem， 或 称 为 有 线 调制 解 调 器 或 电缆 调制 解 调 器 ) 和 数字 
用 户 线路 ( Digital Subscriber Line，DSL)。 这 两 种 服务 在 提供 一 些 其 他 服务 的 同时 ， 并 利用 
异步 传输 模式 及 类 似 技 术 来 提供 到 互联 网 的 永久 性 连接 。 就 有 线 调制 解 调 器 情形 而 言 ， 对 应 
的 其 他 服务 最 初 是 有 线 电 视 服 务 。 对 于 数字 用 户 线 路 情形 而 言 ， 对 应 的 其 他 服务 则 是 普通 老 
式 电话 服务 。 鉴 于 采用 了 蜡 步 传输 模式 技术 ， 有 线 调 制 解 调 器 也 可 以 用 于 传送 普通 老式 电话 
服务 ， 不 过 这 是 人 们 后 来 对 原 有 概念 的 补充 。 另 外 ， 随 着 光缆 ( fiber optic cable， 或 称 为 光 
纤 电 缆 ) 进一步 延伸 到 各 当地 社区 ， 每 个 客户 的 可 用 带宽 正在 不 断 加 大 ， 并 且 光 缆 最 终 应 该 
会 直接 到 达 各 家 各 户 或 每 个 办 公 室 。 这 一 技术 的 发 展 伴随 有 许多 不 同 的 名 称 ， 且 大 体 上 类 似 
于 “光纤 入 户 ”(Fiber to The Curb，FTTC) 这 样 的 提 法 。 


15.7 ”物理 层 


为 了 让 信息 从 一 台 设 备 流向 另 一 台 设 备 ， 必 须要 通过 某 种 介质 把 两 台 设 备 连接 起 来 。 有 
关 介质 必须 能 够 以 某 种 方式 发 生 改 变 ， 且 相应 变化 可 以 被 男 一 台 设备 所 感知 到 。 在 历史 上 ， 
对 于 计算 机 数据 来 说 ， 这 便 意 味 着 是 某 种 类 型 的 金属 线 把 两 台 设备 连接 到 一 起 并 在 其 间 传 导 
电流 。 而 在 最 近 的 这 几 年 里 ， 铜 线 常常 被 传导 光 的 玻璃 或 塑料 所 替代 。 与 此 同时 ， 通 过 电磁 
传输 的 无 线 传输 也 经 常 被 用 来 发 送信 息 。 几 十 年 来 ， 无 线 传输 曾经 只 是 用 于 模拟 音频 和 视频 
信号 的 传输 以 及 文本 电报 的 传输 。 但 在 最 近 的 这 几 年 中 ， 无 线 传输 已 经 更 加 普遍 地 被 用 来 进 
行 数据 传输 。 最 初 ， 其 被 用 于 模拟 数据 的 数字 化 传输 ， 然 而 现在 ， 正 广泛 地 用 在 数据 传输 领 
域 ， 这 对 于 笔记 本 电脑 和 手持 式 计算 机 来 说 特别 常见 。 


15.7.1 铜 线 规 格 


通信 布线 中 所 采用 的 金属 线 通常 是 铜 线 ， 并 且 每 条 线路 往往 由 两 根 导线 组 成 。 有 时 ， 这 
两 根 导 线 是 相同 的 ， 并 且 相 互 缠绕 在 一 起 ， 故 而 被 称 为 双 绞 线 (twisted pair)。 一 般 而 言 ， 绞 
合 在 一 起 的 导线 既 不 太 可 能 从 其 他 导线 摄取 辐射 信号 ， 也 不 太 可 能 辐射 出 让 外 部 可 以 捕获 的 
信和 号 。 同 时， 在 两 根 导线 (或 组 合 到 一 起 作为 一 条 电缆 的 若干 对 导线 ) 的 外 面 还 会 缠绕 上 一 
层 稍 ， 这 被 称 为 屏蔽 型 双 绞 线 ( Shielded Twisted Pair，STP) 布线 方式 。 如 果 没 有 这 种 保护 ， 
则 被 称 为 非 屏蔽 型 双 绞 线 ( Unshielded Twisted Pair，UTP) 。 与 非 屏蔽 型 双 绞 线 相 比 ， 屏 项 
型 双 绞 线 更 不 容易 受到 外 部 的 干扰 ， 也 更 不 容易 被 网 络 外 部 截获 信和 号。 历史 上 在 家 庭 和 企业 
中 安装 电话 线 时 所 采用 的 电线 就 是 某 种 类 型 的 双 绞 线 。 用 于 数据 传输 的 非 屏 项 型 双 绞 线 电 缆 
要 求 拥有 比 标准 电话 线 更 高 的 质量 。 非 屏蔽 型 双 绞 线 布 线 的 质量 一 般 按照 美国 通信 工业 协会 
(Telecommunication Industry Association，TIA) 的 类 别 (Category， 简 记 作 Cat) 进行 规范 和 
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标准 化 。 目 前 批准 用 于 新 建 数据 设施 的 最 低 类 别 是 Cat 5， 对 应 速率 大 约 为 100Mbps。 而 最 
新 的 标准 则 是 Cat 6， 对 应 速率 为 250Mbps。 下 一 步 将 会 推出 Cat 7 标准 ， 即 在 100 米 的 铜 
线 电缆 上 运行 10Gb ( 千 兆 位 ) 的 以 太 网。 

另外 ， 还 有 一 种 称 为 同 轴 电缆 (coaxial cable，coax) 的 铜 制 线路 配置 。 对 于 这 种 情况 
而 言 ， 是 在 单一 的 中 心 导 体外 面包 里 上 绝缘 材料 。 然 后 ， 在 相应 绝缘 层 的 外 围 再 编织 上 一 层 
非常 薄 的 线路 。( 偶 尔 ， 外 面 的 这 一 层 会 是 结实 的 ， 就 像 一 根 管子 。) 这 一 层 成 为 导线 对 的 第 
二 根 “ 电 线 ”。 由 于 中 心 的 电线 是 在 外 层 的 中 心 (或 轴 上 )， 因 此 这 两 根 电线 是 同 轴 的 。 与 屏 
项 型 双 绞 线 相 比 ， 同 轴 电 缆 向 外 辐射 自身 信号 的 可 能 性 更 小 ， 同 时 也 更 不 容易 摄取 外 部 的 信 
号 。 然 而 ， 同 轴 电 缆 要 更 为 昂贵 ， 故 而 仅 限于 一 些 特 殊 的 用 途 。 进 一 步 说 ， 同 轴 电 缆 正 是 有 
线 电视 所 采用 的 电线 类 型 。 在 建筑 物 内 所 使 用 的 有 线 电视 同 轴 电 缆 的 粗细 跟 铅 笔 差不多 ， 与 
非 屏蔽 型 双 绞 线 电缆 相 比 显得 有 些 不 太 灵 活 。 


15.7.2 ”光纤 规格 


光纤 几乎 完全 没有 向 外 辐射 信号 的 问题 。 不 过 ， 它 也 有 点 贵 ， 价 格 大 约 是 铜 线 电缆 的 两 
借 。 但 是 ， 鉴 于 光纤 几乎 不 会 发 生 错误 ， 所 以 得 到 了 广泛 的 使 用 。 另 外 值得 一 提 的 是 ， 光 纤 
可 以 在 相当 长 的 距离 上 传输 数据 。 实 际 上 ,在 2001 年 ， 就 有 一 家 供应 商 实 实在 在 地 演示 了 
通过 一 根 没 有 中 继 器 的 光纤 实现 跨 美国 大 陆 的 传输 。 光 纤 具有 非常 高 的 带宽 性 能 ， 因 此 对 于 
需要 处 理 大 量 数据 的 场合 ， 用 于 传输 每 位 的 价格 可 能 会 非常 低 。 绝 大 多 数 的 新 的 广域网 线路 
采用 了 光纤 ， 同 时 ， 光 纤 在 建筑 物 或 大 院内 的 局 域 网 骨干 网 上 也 是 很 常见 的 。 

当 电 话 运营 商 最 初 接 通 光纤 链 路 时 ， 它 们 运行 得 非常 好 。 这 一 方面 就 体现 在 ， 其 间 发 
生 的 错误 率 非常 低 。 每 根 光纤 只 是 由 于 接收 者 电路 的 物理 限制 而 定格 在 大 约 5 Gbps ( 千 兆 
位 / 秒 ) 的 数据 传输 速率 上 。 然 而 ， 当 光纤 使 用 了 一 段 时 间 之 后 ， 有 关 工 程 师 便 意识 到 了 一 
种 简单 、 廉 价 并 且 可 靠 的 光学 处 理 途 径 ， 那 就 是 通过 在 每 一 端 都 使 用 一 个 棱镜 来 实现 多 组 
信号 在 同一 根 光纤 上 的 组 合 。 这 种 技术 被 称 为 波 分 复 用 ( Wavelength Division Multiplexing， 
WDM)， 有 时 也 称 为 密集 波 分 复 用 ( Dense Wavelength Division Multiplexing，DWDM) 技术 。 
为 此 ， 所 安装 的 每 根 光纤 现在 就 可 以 承载 64 一 128 倍 于 最 初 想 法 的 那么 多 的 数据 。 由 于 线路 
用 地 成 本 及 光纤 安装 本 身 的 成 本 是 一 项 最 主要 的 因素 ， 这 便 意 味 着 后 来 的 广 域 带宽 成 本 的 急 
剧 下 降 。 这 种 下 降 具 体 还 表现 为 最 近 几 年 的 长 期 电话 费 率 的 迅速 下 降 。 事 实 上 ， 在 许多 情况 
下 ， 如 果 相 关 客 户 同意 购买 本 地 服务 ， 当 地 电话 公司 是 可 以 承受 得 起 为 他 们 的 客户 免费 提供 
长 途 线路 的 。 


15.7.3 无线 网 络 


如 前 所 述 ， 在 数字 数据 传输 领域 中 相对 比较 新 的 方式 是 通过 无 线 介 质 (主要 是 数字 无 线 
电 ) 来 进行 通信 9。 这 项 技术 显然 适用 于 笔记 本 电脑 和 手持 式 计算 机 ， 但 同时 也 适用 于 主机 
必须 频繁 地 搬 来 搬 去 或 者 因 物 理 条 件 限 制 而 无 法 直接 布线 的 场合 。 如 果 愿 意 ， 移 动 系统 一 一 
机 器 人 将 会 是 另外 一 个 很 有 前 途 的 领域 。 关 于 无 线 通信 的 电子 电气 工程 师 协会 (IEEE) 标准 
是 802.11， 其 对 应 的 市 场 营 销 名称 Wi-Fi ( Wireless Fidelity， 无 线 保 真 ) 为 人 们 所 熟知 。 网 
桥 、 路 由 器 、 个 人 计算 机 卡 之 网 卡 、 外 围 部 件 互 联 标准 网 卡 等 各 种 设备 都 可 以 很 方便 地 连接 


日 ”其实 ， 以 前 也 曾经 使 用 过 无 线 网 络 。 它 们 在 传统 上 曾 被 用 于 军事 领域 或 者 诸如 夏威夷 群岛 之 类 的 铺设 电 
缆 成 本 极其 昂贵 、 令 人 望而却步 的 地 方 。 
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到 无 线 局 域 网 上 。 相 关 设 备 可 能 会 继续 填充 这 一 有 利 可 图 的 市 场 。 另 一 种 无 线 协议 一 一 蓝牙 
( Bluetooth)， 则 通过 一 种 安全 的 、 低 成 本 的 无 线 链 路 方便 了 诸如 个 人 数字 助理 ( Personal 
Digital Assistant，PDA)、 移 动 电话 、 笔 记 本 电脑 、 计 算 机 、 打 印 机 以 及 数码 相机 ( digital 
cameras) 之 类 的 无 线 设 备 之 间 的 信息 交换 。 蓝 牙 协 议 正 在 由 电子 电气 工程 师 协会 审定 为 标 
准 802.15。 该 标准 系列 中 的 协议 变种 是 为 较 短 距离 的 通信 而 设计 的 ， 这 类 网 络 有 时 被 称 为 个 
人 区 域 网 络 ( Personal Area Network，PAN ) 或 身体 区 域 网 络 (Body Area Network，BAN， 
或 简称 体 域 网 )。 

无 线 方式 非常 容易 受到 来 自 外 部 源 的 干扰 ， 同 时 相关 通信 信号 也 很 容易 被 其 他 设备 无 意 
或 有 意 地 截取 到 。 无 线 方式 的 主要 优点 是 两 个 通信 设备 之 间 不 需要 进行 物理 连接 。 由 于 存在 
噪声 的 问题 ， 无 线 通 信 便 推动 了 比较 强大 的 错误 检测 、 校 正 及 安全 机 制 的 构建 。 不 过 ， 鉴 于 
采用 电缆 和 光纤 的 通信 方式 并 不 存在 这 些 错误 ， 所 以 相关 机 制 的 开发 稍 有 滞后 往往 也 是 可 以 
接受 的 事情 。 


15.7.4 关于 网 络 故 障 排查 的 说 阴 


从 实用 角度 来 讲 ， 在 排查 网 络 问 题 时 ,通常 应 当 从 检查 物理 层 开始 有 关 调 查 。 物 理 层 问 
题 ， 特 别 是 间 吹 性 问题 ， 可 能 会 导致 在 其 他 各 层 出 现 形形色色 的 问题 。 因 此 ， 往 往 应 当 首 先 
通过 验证 和 确认 相应 两 个 设备 在 物理 层 上 的 连接 没有 错误 来 开启 网 络 故 障 的 排查 工作 。 


15.8 ”网络 管理 


15.8.1 简单 管理 工具 


互联 网 控制 消息 协议 (Internet Control Message Protocol，ICMP) 和 简单 网 络 管理 协议 
( Simple Network Management Protocol，SNMP) 两 种 特殊 协议 与 传输 控制 协议 / 网 际 协 议 簇 
一 起 运用 于 网 络 管理 方面 。 互 联网 控制 消息 协议 提供 了 多 种 功能 ， 不 过 对 于 网 络 管理 人 员 而 
言 最 触手 可 及 和 容易 理解 的 就 是 其 为 ping 和 tracert (有 时 称 为 traceroute) 等 实用 程序 提供 
了 基础 。ping 例 程 是 一 种 非常 简单 的 工具 ， 主 要 用 于 验证 两 台 设备 之 间 的 连接 。 它 向 目标 主 
机 发 送 一 条 互联 网 控制 消息 协议 回 显 命令 。 而 目标 主机 则 一 般 通 过 互联 网 控制 消息 协议 回 显 
应 答 来 回复 该 回 显 命令 。 关 于 ping 例 程 的 各 种 选项 支持 发 送 大 块 数据 、 循 环 党 试 ping 操作 
等 。 通 过 测量 响应 时 间 及 其 变化 情况 还 可 以 帮助 网 络 操作 人 员 识 别 网 络 中 出 现 的 性 能 问题 。 
tracert 例 程 使 用 一 连 串 的 ping 操作 来 发 现 连接 两 台 网 络 主机 的 一 系列 的 路 由 器 。 其 可 以 给 
出 相应 信息 传输 路 径 上 的 每 一 跳 的 报告 ， 而 这 将 有 助 于 网 络 性 能 问题 的 进一步 定位 。 


15.8.2 简单 网 络 管理 协议 和 网 络 设备 管理 


在 历史 上 ， 简 单 网 络 管理 协议 一 直 是 网 络 管理 软件 用 来 与 网 络 设备 进行 通信 从 而 对 相 
关 设 备 实施 监控 、 配 置 并 为 它们 排除 故障 的 协议 。 大 多 数 可 管理 的 网 络 设备 往往 拥有 一 组 
参数 ， 而 这 些 参 数 将 会 提供 相关 信息 或 允许 改变 。 进 一 步 说 ， 这 些 参数 将 通过 管理 信息 库 
(Management Information Base，MIB ) 来 加 以 描述 。 从 外 部 来 看 ， 很 容易 认为 有 关 设 备 实际 
存储 了 管理 信息 库 本 身 。 但 实际 上 ， 管 理 信息 库 只 是 一 种 用 来 描述 相关 数据 及 其 语义 和 数据 
传输 格式 的 方便 的 结构 化 的 方式 。 有 关 设 备 可 以 采用 任何 便利 的 方式 来 存储 相关 数据 值 。 互 
联网 工程 任务 组 已 经 对 相当 多 的 管理 信息 库 进 行 了 标准 化 ， 其 中 包括 关于 诸如 以 太 网 端口 的 
特定 硬件 类 型 的 管理 信息 库 以 及 关于 诸如 传输 控制 协议 和 用 户 数据 报 协议 等 各 种 协议 的 管理 
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信息 库 。 不 过 ， 供 应 商 们 还 男 外 添加 了 许多 自己 专 有 的 管理 信息 库 扩展 。 

管理 员 很 少 会 直接 看 到 简单 网 络 管理 协议 。 相 反 ， 像 路 由 器 之 类 的 网 络 设备 的 管理 信 
息 库 一 般 用 于 开发 软件 工具 ， 以 支持 采用 简单 网 络 管理 协议 且 通 过 图 形 化 用 户 界面 来 实现 对 
网 络 设备 的 远程 管理 。 其 中 某 些 工具 设计 得 非常 精巧 ， 所 显示 的 图 像 上 ， 既 有 灯光 闪烁 的 各 
种 设备 ， 还 有 利用 不 同 颜色 来 指示 网 络 状态 的 地 图 。 遗 憾 的 是 ， 这 些 软 件 工具 往往 都 是 专用 
的 ， 所 以 许多 大 型 的 网 络 运营 中 心 (Network Operation Center，NOC ) 常常 充斥 了 几 十 台 运 
行 着 各 种 不 同 软件 包 的 工作 站 。 这 便 要 求 在 掌握 各 种 软件 包 奇 特 功能 的 诸多 操作 人 员 之 间 展 
开 广 泛 的 换 位 培训 和 交叉 训练 。 

当前 的 趋势 是 ， 在 有 关 设 备 中 放置 上 专用 的 特定 的 超 文本 标记 语言 ( HyperText Markup 
Language，HTML ) 服务 器 实体 ， 并 采用 基于 应 用 层 超 文本 传输 协议 ( HyperText Transfer 
Protocol，HTTP) 的 网 络 浏览 器 来 具体 实施 相关 操作 。 这 便 意 味 着 不 再 经 常 需 要 专用 的 管理 软件 ， 
并 且 对 交叉 训练 的 需求 也 将 有 所 减少 。 但 是 ， 我 们 仍然 有 必要 了 解 相关 网 络 设备 的 具体 特性 ， 
而 只 是 说 ， 由 于 浏览 器 对 所 有 这 些 设 备 都 是 标准 的 ， 故 而 所 要 求 的 培训 工作 大 大 减少 了 。 


15.8.3 ”数据 包 捕 获 


对 于 以 太 网 是 使 用 集线器 构建 起 来 的 情况 ， 网 络 上 的 每 个 网 卡 都 会 看 到 通过 局 域 网 发 
送 的 每 个 数据 包 。 通 常情 况 下 ， 网 络 适配器 往往 只 会 读 取 带 有 广播 地 址 、 多 播 地 址 或 者 网 络 
适配器 自身 地 址 的 数据 包 。 但 是 ， 一 些 网 络 适 配器 也 可 以 被 设置 为 混杂 模式 ( promiscuous 
mode)， 在 这 种 情况 下 ， 它 们 就 会 读 取 网 络 上 的 每 一 个 数据 包 。 这 便 成 为 网 络 协议 故障 排查 
的 有 力 工 具 。 人 们 开发 了 许多 非常 精巧 的 工具 ， 其 中 最 著名 的 是 由 网 络 通用 公司 ( Network 
General Corporation) 开发 的 嗅 探 器 软件 Sniffer*。 此 类 工具 常常 拥有 很 多 功能 选项 。 例 如 ， 
它们 可 以 被 设置 为 仅仅 捕获 满足 特定 标准 的 信息 流 、 只 有 在 发 现 某 类 触发 事件 之 后 才 开启 捕 
获 过 程 、 把 所 捕获 到 的 数据 包 保存 到 硬盘 上 以 及 仅仅 针对 所 关注 的 层级 创建 数据 包 的 解码 显 
示 结 果 。 遗 憾 的 是 ， 这 类 工具 同时 也 有 其 不 好 的 一 面 ， 因 为 如 果 所 传输 的 信息 没有 加 密 ， 一 
些 不 道德 的 用 户 就 可 以 使 用 有 关 捕 获 程序 来 查看 特权 信息 和 截获 密码 。 

交换 型 以 太 网 的 发 展 在 很 大 程度 上 解决 了 后 面 的 这 个 问题 ， 因 为 交换 机 只 会 把 寻 址 到 特 
定 设 备 的 信息 流转 发 到 与 相应 设备 所 连接 的 端口 上 。 故 此 ， 数 据 包 捕获 机 制 就 只 能 看 到 广播 
信息 流 、 多 播 信息 流 以 及 发 给 捕获 设备 自身 的 信息 流 。 当 然 ， 这 意味 着 有 关 捕 获 技术 无 法 再 
按照 最 初 设想 的 那样 实现 有 关 意 图 。 出 于 这 些 原因 ， 用 于 大 型 环境 的 交换 机 通常 具有 一 种 称 
为 端口 镜像 ( port mirroring) 的 功能 。 这 项 功能 将 允许 管理 人 员 告 知 有 关 交 换 机 获取 所 有 来 
往 特定 端口 的 数据 包 并 将 其 复制 到 另 一 个 端口 。 然 后 ， 数 据 包 捕获 机 制 就 可 以 符 入 相应 镜像 
端口 中 ,并 且 可 以 像 以 往 那样 捕获 相关 会 话 。 需 要 指出 的 是 ， 只 有 网 络 管理 人 员 才 能 够 打开 
和 启用 这 项 功能 。 


15.8.4 远程 监控 


由 互联 网 工程 任务 组 所 定义 的 管理 信息 库 ， 其 中 有 一 个 管理 信息 库 便 涵盖 了 网 络 的 远程 
监控 ( Remote MONitoring，RMON)。 前 往 远 程 网 络 所 在 地 进行 故障 排除 和 维护 的 成 本 往往 
会 非常 昂贵 ， 因 此 最 好 能 够 通过 网 络 远程 诊断 网 络 问题 。 鉴 于 路 由 器 已 经 对 其 转发 的 每 一 个 
数据 包 进 行 了 检查 ， 所 以 它们 正好 处 于 能 够 完成 这 项 功能 的 独一无二 的 位 置 上 。 关 于 远程 监 
控 的 管理 信息 库 定 义 了 路 由 器 中 的 远程 监控 代理 可 以 维护 的 、 基 本 路 由 器 管理 信息 库 中 的 计 
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数 器 之 外 的 那些 计数 器 。 它 们 还 可 能 包含 完整 的 跟踪 设施 、 基 于 应 用 层 协议 的 统计 信息 以 及 
其 他 有 用 的 信息 。 


15.9 小 结 

在 本 章 中 ， 我 们 对 网 络 系统 的 基本 组 件 进行 了 概述 。 我 们 首先 阐明 了 有 关 目 的 和 动机 ， 
即 为 什么 网 络 的 研究 和 学 习 对 于 整个 计算 机 系统 特别 是 操作 系统 的 理解 是 非常 重要 的 。 我 们 
陈述 了 一 些 基 本 概念 ， 描 述 了 一 个 即将 用 于 本 章 其 余部 分 的 网 络 模型 ， 从 而 为 计算 机 网 络 的 
进一步 讨论 葛 定 了 基础 。 我 们 讨论 了 几 个 应 用 层 协议 以 及 传输 层 和 网 络 层 所 使 用 的 最 知名 的 
协议 ， 即 TCP/IP 协议 徐 。 我 们 还 讨论 了 IBM 公司 及 其 系统 网 络 体系 结构 协议 所 发 挥 的 持续 
重要 的 作用 。 我 们 讨论 了 数据 链 路 层 ， 重 点 是 以 太 网 ， 同 时 还 讨论 了 令 牌 环 和 光纤 分 布 式 数 
据 接 口 ， 并 将 它们 与 以 太 网 进行 了 比较 。 我 们 讨论 了 共享 式 以 太 网 的 缺点 ， 并 说 明了 各 种 速 
率 的 交换 型 以 太 网 已 经 开始 主导 局 域 网 架构 的 主要 理由 。 我 们 也 涵盖 了 广域网 以 及 一 些 并 不 
常见 的 广域网 协议 ， 以 及 为 什么 某 些 情况 下 会 使 用 有 关 协 议 的 原因 。 接 下 来 则 介绍 了 物理 层 
及 其 中 的 一 些 选项 。 最 后 ,我 们 阐述 了 网 络 管理 的 相关 内 容 ， 包 括 简 单 的 实用 程序 、 简 单 网 
络 管理 协议 、 通 常 的 网 络 管理 操作 以 及 向 基于 超 文本 传输 协议 和 浏览 器 的 网 络 管理 模式 迁移 
的 发 展 趋势 。 另 外 ,我 们 也 对 远程 监控 协议 进行 了 扼要 介绍 。 
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习题 

15.1 计算 机 联网 最 初 的 主要 动机 是 什么 ? 

15.2 ”什么 最 终 成 为 计算 机 联网 的 最 显著 的 好 处 ? 

15.3 在 我 们 所 讨论 的 网 络 模型 中 ,每 一 层 均 由 每 台 计算 机 中 的 一 个 实体 来 作为 代表 。 于 是 ， 每 个 这 
样 的 实体 将 会 与 每 个 与 其 相连 接 的 另 一 个 实体 进行 对 话 。 该 实体 会 跟 什么 样 的 其 他 实体 进行 对 
话 呢 ? 

a. 下 一 更 高 层级 的 实体 

b. 下 一 较 低 层级 的 实体 

c. 在 另 一 个 系统 中 的 对 等 实体 
d. 以 上 都 不 是 

15.4 在 广域网 中 ， 就 中 心 站 点 到 达 所 有 结 点 的 速度 而 言 ， 哪 种 拓扑 结构 是 最 高 效 的 ? 
a. 线形 结构 
b. 树 形 结构 
c. 星 形 结构 
d. 环形 结构 
e. 以 上 所 有 拓扑 结构 的 通信 速度 都 相同 

15.5” 哪 种 广域网 拓扑 结构 在 线路 成 本 方面 是 最 昂贵 的 ? 
a. 星 形 结构 
b. 环形 结构 
c. 部 分 互 连 的 网 状 结构 
d. 完全 互 连 的 网 状 结构 
e. 以 上 所 有 拓扑 结构 都 具有 相同 的 线路 成 本 

15.6 一 些 共 享 型 局 域 网 拓扑 结构 并 不 是 非常 高 效 一 一 值得 注意 的 是 ， 共 享 式 以 太 网 的 运行 很 少 会 超 
过 60% 的 效率 。 是 什么 样 的 重大 进展 支持 这 样 的 局 域 网 运行 在 较 高 的 吞吐 量 级 别 上 的 ? 

15.7 动态 主机 配置 协议 是 用 来 完成 什么 任务 的 ? 

a. 把 网 际 协 议 地 址 转换 为 介质 访问 控制 地 址 

b. 把 名 称 转 换 为 网 际 协 议 地 址 

c. 获取 网 际 协议 地 址 及 其 他 信息 

d. 更 新 万 维 网 服务 器 主机 上 的 页 面 

e. 以 上 均 没 有 正确 描述 动态 主机 配置 协议 的 作用 

15.8 ”把 我 们 从 迁移 到 第 6 版 网 际 协 议 的 悬崖 边 上 解救 下 来 的 主要 因素 是 什么 ? 
a. 动 态 主 机 配置 协议 
b. 网 络 地 址 转换 协议 
c. 无 类 别 域 间 路 由 协议 
d. 域名 服务 协议 
e. 以 上 各 种 协议 对 我 们 延迟 使 用 第 6 版 网 际 协议 都 没有 帮助 

15.9 每 个 协议 层 都 必须 在 对 应 报头 中 拥有 一 些 信 息 ， 以 告知 接收 者 实体 应 该 把 传人 的 协议 数据 单元 
( Protocol Data Unit，PDU) 传送 给 一 个 什么 样 的 实体 。 在 传输 层 报头 中 的 什么 信息 将 会 告知 传 
输 控 制 协议 或 用 户 数据 报 协 议 ， 从 而 把 相应 数据 包 传递 给 哪个 应 用 程序 呢 ? 

15.10 ”什么 协议 用 来 把 网 际 协 议 地 址 转换 为 介质 访问 控制 地 址 呢 ? 

a. 地 址 解析 协议 
b. 网 络 地 址 转换 协议 
c. 动态 主机 配置 协议 


15.11 


15,12 
15.13 


15.14 
:1 和 
15.16 
15.17 


15.18 
15.19 


15.20 


15.21 


15.22 


15.23 


15.24 
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d. 内 部 网 关 路 由 协议 

e. 上 述 协 议 均 不 涉及 从 网 际 协议 地 址 到 介质 访问 控制 地 址 的 映射 

哪 种 物理 介质 具有 最 佳 的 抗 于 扰 能 力 ? 

a. 同 轴 电 缆 

b. 屏蔽 型 双 绞 线 

c. 无 线 网 络 

d. 光纤 

e. 所 有 上 述 介 质 均 具有 相同 的 抗 噪声 能 力 | 

根据 我 们 曾经 提 到 的 内 容 ， 局 域 网 和 广域网 的 区 别 主要 体现 在 什么 方面 呢 ? 

我 们 说 过 ,文件 传输 协议 与 我 们 讨论 的 其 他 两 种 协议 相 比 ， 具 有 某 些 特殊 的 地 方 。 请 举例 
说 明 。 

即将 用 于 管理 大 多 数 网 络 设备 (尤其 是 那些 廉价 网 络 设备 ) 的 机 制 是 什么 ? 

在 对 网 络 进行 故障 排查 时 ， 应 当 首 先 检查 哪 一 层 ? 

我 们 说 用 户 数据 报 协议 是 一 种 ' 不 可靠 ”的 协议 。 但 为 什么 我 们 不 设计 一 种 “可靠 ”的 协议 呢 ? 
以 太 网 协议 是 目前 使 用 的 唯一 的 局 域 网 介质 访问 控制 协议 。 这 是 否 正确 ? 

Cat 5 是 什么 意思 ? 

嗅 探 器 (SNIFFER) 是 什么 ? 

a. 炸弹 检测 装置 

b. 用 于 分 析 网 络 协议 的 专 有 设备 

c. 沉迷 于 吸入 挥发 性 化 学 品 的 人 

d. 用 于 和 穷 取 密码 的 软件 程序 

e. 以 上 各 项 均 未 给 出 嗅 探 器 的 正确 描述 

当 我 们 使 用 PING 命令 并 从 主机 获得 响应 时 ， 我们 便 一 下 子 获得 了 许多 信息 。 假 设 我 们 原本 不 
了 解 任何 情况 ， 那 么 我 们 刚才 可 能 获取 到 了 哪些 信息 呢 ? 

域名 服务 协议 是 用 来 做 什么 的 ? 

a. 把 网 际 协议 地 址 转换 为 介质 访问 控制 地 址 

b. 将 名 称 转 换 为 网 际 协议 地 址 

c. 获取 网 际 协议 地 址 及 其 他 信息 

d. 更 新 万 维 网 服务 器 主机 上 的 页 面 

e. 以 上 都 不 是 

网 际 协议 地 址 通常 表示 为 譬如 “129.107.56.23” 这 样 的 方式 。 此 类 地 址 拥有 两 个 部 分 ， 其 中 ， 
“129.107” 是 一 部 分 ， 而 “56.23” 是 男 一 部 分 。 这 些 部 分 是 如 何 使 用 的 ? 

为 网 际 协议 信息 流 选 择 路 径 的 路 由 器 也 可 能 使 用 称 为 路 由 信息 协议 的 协议 。 这 个 协议 是 用 来 做 
什么 的 ? 

电子 邮件 使 用 两 种 不 同类 型 的 协议 ， 例 如 简单 邮件 传输 协议 和 第 三 版 邮局 协议 。 这 两 个 协议 有 
什么 区 别 ? 


第 16 章 | 


Operating Systems: A Spiral Approach 


保护 和 安全 





关于 计算 机 操作 系统 的 安全 问题 ， 过 去 所 提出 的 有 建设 性 的 思想 很 少 。 在 大 多 数 情况 
下 ， 安 全 性 是 通过 控制 物理 访问 来 提供 的 。 计 算 机 就 是 被 锁 在 一 个 带 有 大 量 空 调 的 屋子 里 
的 庞然大物 。 人 允许 访问 系统 的 用 户 会 允许 访问 任何 文件 及 任何 运行 着 的 程序 。 伴 随时 间 的 
推移 ， 相 关 情 况 发 生 了 变化 。 鉴 于 在 同一 时 间 通 常 运行 着 许多 程序 ， 而 它们 分 别 代表 可 能 
存在 着 竞争 利益 关系 的 很 多 用 户 ， 于 是 分 时 ( time sharing) 便 掀起 了 这 场 巨 大 的 变革 。 今 
天 ， 系 统 的 共享 式 访问 已 十 分 常见 ， 尤 其 是 在 我 们 自己 的 家 里 。 甚 至 当 系统 没有 被 共享 的 时 
候 ， 它 们 也 经 常 是 连 到 了 网 络 上 。 在 许多 情况 下 ， 即 使 是 在 家 里 ， 计 算 机 系统 也 会 连 到 局 域 
网 中 。 超 码 来 说 ， 许 多 机 融 可 以 通过 拨号 连接 方式 连 到 互联 网 上 。 尽 管 这 可 能 只 是 间歇 性 
的 连接 ， 但 这 种 连接 将 会 把 我 们 的 系统 暴露 在 整个 互联 网 世界 中 一 一 一 个 威胁 与 惊奇 并 存 的 
地 方 。 

在 第 16.1 节 中 ,我 们 讨论 了 一 些 安全 问题 的 起 源 ， 随 后 ， 我 们 把 它们 分 解 成 若干 不 同 
的 类 别 ， 进 而 描述 了 操作 系统 处 理 相 关 问 题 所 需 的 机 制 ， 而 其 中 的 某 些 机 制 则 需要 驻 留 在 操 
作 系 统 自 身 之 外 的 其 他 地 方 。 接 下 来 ， 在 第 16.2 节 中 ,我 们 对 操作 系统 需要 为 用 户 提供 的 
保护 服务 (主要 是 提供 对 文件 的 保密 性 ) 进行 了 概要 介绍 ， 并 对 这 些 服务 总 体 的 设计 思路 进 
行 了 阐述 。 除 了 操作 系统 必须 为 用 户 提供 的 服务 之 外 ， 还 需要 给 进程 提供 一 种 不 同 级 别 的 服 
务 。 我 们 还 在 运行 进程 与 操作 系统 之 间 建 立 起 了 重要 的 屏障 ， 以 保护 操作 系统 和 所 有 运行 进 
程 。 在 第 16.3 节 中 ， 我 们 会 继续 审视 尝试 通信 和 相互 协作 的 进程 所 需要 的 一 些 服务 。 在 第 
16.4 节 中 ， 我 们 介绍 了 一 般 的 网 络 尤 其 是 因特网 相关 的 安全 ， 包 括 加 密 、 认 证 和 摘要 ， 同 时 
也 讨论 到 了 网 络 安全 以 及 个 人 操作 系统 之 外 所 发 现 的 保护 等 相关 话题 。 在 第 16.5 节 中 ， 我 
们 介绍 了 在 网 络 和 操作 系统 的 安全 管理 中 所 出 现 的 问题 。 在 第 16.6 节 中 ， 我 们 对 本 章 进行 
了 归纳 总 结 。 


16.1 问题 和 威胁 


我 们 应 当 有 许多 理由 不 去 盲目 地 信任 所 有 的 程序 。 程 序 员 可 能 会 厌倦 无 聊 、 疲 惫 不 堪 ， 
抑或 懒惰 、 粗 心 、 无 知 、 轧 钝 ， 还 可 能 存心 不 良 或 邪恶 透 项 。 在 某 些 情 况 下 ， 其 中 的 任意 一 
项 或 者 全 部 合 到 一 起 ， 都 可 以 创造 出 一 个 能 够 破坏 我 们 的 工作 甚至 我 们 的 系统 的 程序 来 。 一 
般 来 说 ， 我 们 需要 担心 两 类 人 。 黑 客 (hacker) 对 于 家 庭 用 户 来 讲 非常 危险 ， 因 为 他 们 往往 
会 攻击 系统 的 薄弱 环节 ， 而 这 经 常 是 大 多 数 家 庭 用 户 甚至 没有 足够 知识 可 以 认识 到 或 很 少 去 
处 理 的 方面 。 同 时 ， 黑 客 也 是 最 臭名 昭著 的 ， 但 他 们 只 是 问题 的 一 部 分 。 另 一 个 不 太 出 名 的 
问题 是 ， 合 法 进入 系统 的 人 的 未 经 授权 的 访问 。 此 类 内 部 问题 涉及 面 非常 广泛 ， 具体 包括 发 
送 辱骂 性 或 威胁 性 的 电子 邮件 、 从 账户 偷盗 钱财 或 者 从 库存 窃取 货物 、 浪 费时 间 去 浏览 与 工 
作 不 相关 的 网 站 或 者 在 计算 机 上 玩 游 戏 、 突 探 其 他 员工 的 个 人 信息 、 抄 袭 其 他 同学 的 课题 或 
论文 ， 以 及 贪污 受贿 、 硕 诈 勒索 、 把 公司 秘密 卖 给 竞争 对 手 ， 等 等 。 大 多 数 此 类 问题 都 是 很 
难 发 现 或 控制 的 ， 因 为 参与 这 些 行动 的 人 可 以 合法 地 进入 系统 。 一 般 来 说 ,我们 必须 要 通过 
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操作 系统 控制 之 外 的 某 些 手段 来 识别 这 些 行为 。 我 们 需要 依赖 实地 清点 、 审 计 等 各 种 方法 。 
从 某 些 方面 来 看 ， 黑 客 往往 被 迫使 用 一 套 有 限 的 非法 机 制 来 获得 访问 权限 ， 所 以 他 们 更 容易 
控制 。 如 果 我 们 足够 勤勉 ， 我们 可 能 最 终 是 能 够 识别 和 保护 大 多 数 相 关机 制 的 。 但 是 ， 在 这 
之 前 ， 鉴 于 系统 的 复杂 性 ,保护 大 型 系统 是 非常 困难 的 (也 有 人 说 是 不 可 能 的 )。 

黑客 通常 会 利用 操作 系统 中 的 某 个 问题 ， 设 法 去 执行 一 个 其 并 未 被 许可 执行 的 操作 。 这 
往往 会 使 他 们 以 超级 用 户 ( supervisor) 或 管理 员 ( administrator) 所 拥有 的 权限 获准 使 用 系 
统 ， 而 相关 权限 基本 上 将 允许 他 们 可 以 做 他 们 想 做 的 任何 事情 。 大 多 数 情 况 下 ， 这 些 机 制 会 
利用 到 操作 系统 里 的 某 个 缺陷 或 漏洞 。 通 常 ， 操 作 系 统 供应 商 将 会 很 快 认识 到 这 些 漏洞 ， 并 
会 发 布 相 应 的 操作 系统 补丁 ， 以 切断 黑客 可 以 利用 相关 漏洞 的 途径 。 遗 憾 的 是 ， 这 些 补 丁 并 
没有 像 一 套 完整 的 操作 系统 发 行 版 那样 进行 过 完备 的 测试 ， 所 以 并 不 是 所 有 的 用 户 都 愿意 安 
装 这 些 补 丁 包 ， 而 是 让 这 些 漏洞 继续 暴露 着 。 这 对 于 那些 必须 管理 用 来 完成 许多 不 同 任务 的 
许多 不 同系 统 的 企业 管理 人 员 来 说 ， 尤 其 如 此 。 尽 管 单独 个 体 或 许 能 够 很 快 地 判定 一 个 漏洞 
修复 程序 会 否 引 发 一 个 问题 ， 而 一 个 企业 管理 人 员 则 可 能 因为 要 对 许多 系统 负责 ， 所 以 可 能 
不 太 愿意 冒 这 样 的 风险 。 

我 们 可 能 看 到 的 黑客 威胁 可 以 归 类 人 处理， 从 而 使 我 们 能 够 确定 如 何 去 处 理 这 些 威胁 。 其 
中 ， 首 要 的 就 是 我 们 现在 称 为 恶意 软件 (malware) 的 通用 类 型 。 恶 意 软 件 是 一 个 比较 新 的 
词 ， 由 若干 子 类 聚合 而 成 ， 具 体 包 括 病毒 程序 、 蠕 虫 、 特 洛 伊 木马 和 间谍 软件 。 


16.1.1 计算 机 病毒 


计算 机 病毒 ( computer virus) 是 那些 以 类 似 于 生物 病毒 将 自己 插入 活 细胞 中 的 方式 而 把 
自己 插入 其 他 程序 中 的 程序 段 。 当 包含 有 病毒 的 程序 在 计算 机 系统 上 运行 时 ， 病 毒 将 会 把 自 
己 插入 辅助 存储 器 上 的 其 他 程序 中 。 对 于 病毒 的 编写 者 来 说 ， 最 难 的 部 分 就 是 让 用 户 去 运行 
包含 有 病毒 的 程序 。 现 在 ， 这 往往 是 通过 把 病毒 程序 附着 到 电子 邮件 上 而 使 用 户 加 以 执行 的 
方式 来 实现 的 。 当 大 多 数 软件 是 以 软盘 来 进行 分 发 的 时 候 ， 一 种 常见 的 技术 就 是 感染 软盘 引 
导 扇 区 中 所 找到 的 程序 。 如 果 系 统 在 软件 安装 后 重新 启动 (经 常会 要 求 这 样 操作 )， 而 上 一 
次 的 软盘 并 没有 从 驱动 器 中 取 下 ， 那 么 往往 会 从 软盘 启动 ， 于 是 病毒 就 会 传播 到 硬盘 上 。 接 
下 来 ， 该 硬盘 便 会 感染 插入 系统 的 每 一 块 软盘 。 一 旦 这 种 病毒 在 集体 环境 中 被 释放 出 来 ， 那 
入 其 就 基本 不 可 能 彻底 被 根除 掉 ， 因 为 许多 软盘 放 得 到 处 都 是 ， 各 式 各 样 的 桌子 的 抽 屠 里 、 
公文 包 里 、 家 里 的 衣柜 顶部 ， 等 等 。 

今天 ,我 们 往往 会 拥有 称 为 病毒 扫描 器 的 保护 程序 驻 留 在 内 存 中 ， 监 视 程序 是 否 携带 病 
毒 、 正 在 准备 复制 或 者 运行 ， 进 而 防止 相应 复制 或 执行 操作 。 这 些 扫描 程序 通过 匹配 已 知 的 
指令 模式 或 者 异常 行为 (例如 ， 一 系列 的 系统 调用 ， 或 者 试图 去 修改 特定 的 系统 文件 或 注册 
部 分 ) 进行 扫描 识别 处 理 。 遗 憾 的 是 ， 鉴 于 新 型 病毒 不 断 地 被 创造 出 来 ,数据 和 行为 模式 的 
数据 库 必须 随时 更 新 。 虽 然 程序 本 身 常 常 是 免费 的 ,但 是 在 试用 期 以 后 ， 数 据 库 的 维护 更 新 
则 不 再 免费 。 为 此 ,许多 人 不 会 费劲 去 运行 扫描 程序 ， 或 者 不 会 付费 购买 升级 ， 于 是 ， 很 久 
以 前 就 应 该 被 消除 的 病毒 仍然 在 继续 传播 。 就 像 在 生物 世界 一 样 ， 一 些 病毒 只 是 让 人 讨厌 ， 
而 一 些 则 会 造成 灾难 性 的 危害 。 与 那些 破坏 性 较 小 的 病毒 比 起 来 ， 那 些 会 瘫痪 系统 的 病毒 往 
往 可 能 扩散 得 不 会 很 历 害 。 系 统 崩 溃 会 引起 用 户 的 关注 ， 从 而 可 能 导致 相应 机 器 上 的 病毒 的 
根除 。 但 是 ， 小 幅 的 减速 问题 通常 可 能 不 会 被 注意 ,或 者 可 能 是 被 容忍 了 ， 因 为 解决 相关 问 
题 或 者 成 本 太 高 或 者 会 耗费 太 多 的 时 间 。 
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16.1.2 ”特洛伊 木马 


特洛伊 木马 ( Trojans， 或 简称 木马 ) 是 指 那些 并 非 是 它们 看 起 来 那样 的 程序 。 这 个 术语 
据说 源 自 于 特洛伊 战争 期 间 所 使 用 的 一 项 技术 ， 当 一 方 伴 装 从 战场 上 撤退 时 ， 却 留 下 了 一 个 
巨大 的 马 的 木 制 雕 像 ， 其 实 马 像 里 面 藏 着 一 队 士兵 。 守 城 的 军队 将 木马 拉 进 城 里 ， 并 为 信和 以 
为 真 的 胜利 举行 了 盛大 的 庆祝 活动 。 到 了 晚上 ， 隐 藏 的 士兵 从 木马 中 私 了 出 来 ， 打 开 城 门 ， 
放 进 假装 撤退 且 业 已 返回 的 已 方 部 队 ， 从 而 占领 和 洗 动 了 这 座 城池 。 木 马 程序 看 起 来 是 某 种 
功能 的 程序 ， 然 而 ， 其 或 者 完全 在 做 着 别 的 事情 ， 或 者 在 做 它们 看 起 来 所 做 事情 的 同时 还 做 
着 别 的 什么 事情 一 一 用 户 没有 注意 到 的 某 类 事情 。 例 如 ， 相 应 程序 可 能 看 起 来 是 一 个 屏幕 保 
护 程序 ， 但 同时 还 安插 了 一 个 进程 ， 而 该 进程 将 会 窃听 所 有 密码 ， 并 把 密码 发 送 给 另 一 个 国 
家 的 某 个 网 站 。 一 般 来 说 ， 防 范 病毒 所 用 的 相同 技术 也 会 防范 木马 。 


16.1.3 ”蠕虫 


蠕虫 (worm) 是 类 似 于 病毒 和 木马 的 程序 ， 但 也 有 点 不 同 。 它 们 不 会 感染 其 他 程序 ， 也 
不 会 假装 做 某 类 事情 。 当 一 个 蠕虫 程序 第 一 次 运行 时 ， 它 只 是 试图 将 自己 传送 到 其 他 机 器 
上 ， 并 欺骗 操作 系统 去 启动 运行 。 接 下 来 ， 在 那 台 机 器 上 ， 它 又 会 尝试 把 自己 发 送 到 另外 
的 机 器 上 ， 以 此 类 推 。1988 年 ， 康 奈 尔 大 学 ( Cornell University) 的 一 名 博士 生 编写 和 触发 
了 一 个 称 为 互联 网 蠕虫 ( Internet Worm) 的 小 程序 。 他 的 意图 是 ， 这 个 程序 将 是 隐形 的 ， 即 
不 会 做 任何 看 得 见 的 事情 ， 它 将 被 设计 成 把 自己 传播 到 尽 可 能 多 的 计算 机 上 而 不 留 下 任何 痕 
迹 。 如 果 代 码 正确 运行 ,那么 只 会 有 唯一 的 一 个 进程 运行 在 众多 连接 到 互联 网 的 计算 机 上 。 
遗憾 的 是 ， 代 码 并 没有 按 设想 的 那样 工作 。 该 蠕虫 程序 迅速 地 向 四 处 传播 和 扩散 开 来 ， 而 且 
一 台 受 感染 的 机 器 经 常会 把 蠕虫 传 回 到 先前 传 给 它 的 那 台 机 器 上 。 结 果 是 ， 这 些 各 自 并 不 占 
用 太 多 处 理 器 时 间 的 小 型 进程 ， 伴 随 越 来 越 多 的 蠕虫 进程 在 受 感染 的 每 台 机 器 上 启动 起 来 ， 
蠕虫 程序 开始 淹没 和 浸 满 了 系统 。 大 多 数 情况 下 ， 在 不 到 90 分 钟 之 后 ， 蠕 虫 程序 将 会 使 被 
感染 的 系统 无 法 使 用 。 没 有 人 可 以 实际 确定 到 底 有 多 少 台 机 器 被 这 种 蠕虫 所 感染 ， 但 据 估 
计 ， 大约 涉 及 6000 台 左 右 。 另 外 ， 该 蠕虫 程序 基本 上 让 互联 网 瘫痪 了 大 致 一 天 左右 的 时 间 。 
幸运 的 是 ， 它 只 攻击 运行 BSD UNIX 系统 特定 版 本 的 VAX 和 SUN 计算机。 蠕虫 也 可 以 被 
病毒 扫描 程序 检测 出 来 并 加 以 根除 。 

蠕虫 不 一 定 是 破坏 性 的 。 蠕 虫 的 最 初 开 发 是 在 20 世纪 80 年 代 早期 的 Xerox PARC 装置 
上 。 相 关 蠕 虫 程序 主要 用 来 在 下 班 时 间 通 过 网 络 进行 分 布 式 处 理 、 广 播 通信 和 软件 分 发 等 
活动 。 
16.1.4 间谍 软件 


间谍 软件 (Spyware) 是 一 种 特殊 类 型 的 木马 。 此 类 程序 要 相对 温和 一 些 ， 它 们 不 会 损 
坏 自己 运行 所 在 的 计算 机 或 者 任何 用 户 数据 。 它 们 通常 所 做 的 也 就 是 向 一 些 不 相关 的 网 站 报 
告 本 机 的 活动 。 在 最 良性 的 情况 下 ， 这 些 报告 的 信息 只 是 确定 哪些 网 站 在 被 访问 ， 从 而 帮助 
某 些 系统 把 广告 投放 到 用 户 可 能 比较 感 兴趣 的 那些 网 站 上 。 事 实 上 ， 这 里 存在 一 个 灰色 区 
域 ， 其 中 的 活动 可 以 被 看 作 是 有 实际 益处 的 。 纯 朴 的 用 户 常 常 被 一 些 缺 乏 道德 原则 的 广告 商 
误导 而 安装 上 “屏幕 保护 程序 ”和 “浏览 器 工具 栏 ”， 其 实 它们 就 是 含有 此 类 间谍 软件 的 特 
洛 伊 木马 。 至 少 来 说 ， 相 关 用 户 并 不 经 常会 被 告知 ， 系 统 正在 安装 这 些 其 他 的 功能 。 在 最 坏 
的 情况 下 ， 音 乐 光盘 的 供应 商会 趁 着 他 们 的 一 张 光 盘 在 计算 机 上 播放 的 时 候 安装 间谍 软件 
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包 ， 或 者 税务 软件 的 供应 商 在 他 们 的 软件 被 安装 的 时 候 通过 误导 用 户 尝试 实施 数字 版 权 管 理 
( Digital Rights Management，DRM) 来 启动 间谍 软件 包 的 安装 ,并且 所 有 这 些 安装 过 程 都 是 
在 没有 通知 软件 用 户 的 情况 下 完成 的 。 在 这 两 种 情况 下 ， 系 统 性 能 都 会 有 所 降低 ， 而 且 新 的 
安全 漏洞 将 会 被 暴露 到 互联 网 上 。 更 恶意 的 情况 则 是 ， 间 谍 软 件 可 能 用 来 窃取 网 站 甚至 信用 
卡 账户 的 密码 。 幸 运 的 是 ， 一 些 特 殊 的 扫描 软件 能 够 识别 并 会 删除 大 多 数 的 间谍 软件 。 一 个 
间谍 软件 程序 所 造成 的 破坏 并 不 常常 是 太 过 惨重 的 。 但 是 ， 当 在 初级 用 户 拥有 的 机 器 上 第 一 
次 运行 扫描 软件 的 时 候 ， 查 出 成 百 上 千 的 间谍 软件 则 是 稀 玖 平常 的 事情 ， 而 且 这 些 系 统 在 此 
等 扫描 负荷 之 下 基本 不 能 再 干什么 其 他 事情 。 在 本 书写 作 之 时 ， 间 谍 软 件 类 检测 程序 已 经 开 
始 与 病毒 类 扫描 软件 进行 合并 ， 从 而 形成 一 种 更 加 通用 的 恶意 软件 类 扫描 程序 。 


16.1.5 拒绝 服务 攻击 


尽管 刚才 描述 的 互联 网 蠕虫 的 本 意 是 良性 的 ， 遗 憾 的 是 ， 从 其 运行 所 造成 的 副 效应 来 
讲 ， 它 还 是 另外 一 类 攻击 即 拒绝 服务 ( Denial of Service，DoS ) 攻击 的 一 个 例子 。 这 种 蠕虫 
所 招致 的 结果 是 授权 用 户 无 法 访问 机 器 ， 或 者 说 是 操作 系统 因为 很 少 在 其 被 推 向 的 这 种 压力 
极限 条 件 下 进行 测试 所 以 表现 欠 佳 和 不 能 正常 运转 ， 称 为 拒绝 服务 。 拒 绝 服务 攻击 往往 是 指 
一 种 有 意 作用 下 的 结果 ， 而 不 是 一 种 副 效应 。 此 类 攻击 非常 多 见 ， 我 们 在 这 里 主要 描述 其 中 
较为 典型 的 两 种 案例 。 第 一 种 称 为 死 兵 攻击 ( Ping of Death)。ping 是 网 络 管理 员 用 来 测试 
网 络 连接 的 一 种 特殊 的 命令 。 服 务 器 在 接收 到 ping 命令 后 ， 将 会 对 发 送 者 做 出 反馈 和 回应 ， 
这 样 发 送 者 就 可 以 知道 目标 机 器 是 可 达 的 。 为 了 让 程序 更 为 实用 和 有 效 ， 发 送 者 可 以 发 送 一 
个 较 大 的 数据 包 ， 且 可 发 送 若 干 次 ， 以 确认 平均 的 响应 时 间 。 对 于 所 附 的 数据 包 ， 一 般 设 定 
最 大 应 为 64KB， 但 是 也 有 可 能 蓄意 创建 一 个 大 小 超过 64KB 的 ping 数据 包 。 遗 憾 的 是 ,不 
少 操作 系统 都 拥有 一 种 ping 操作 实用 例 程 将 会 试图 接收 这 种 数据 包 ， 并 将 之 放 入 一 个 至 多 
只 有 64KB 大 小 的 缓冲 区 中 。 如 果 接 收 到 超过 64KB 的 数据 包 ， 那么 数据 将 会 把 非 设 计 中 的 
某 些 东西 覆盖 掉 ， 而 这 常常 会 带 来 严重 的 后 果 。 这 种 攻击 不 会 对 发 送 者 带 来 任何 好 处 ， 而 只 
会 对 目标 对 象 造 成 伤害 。 

另 一 种 拒绝 服务 攻击 称 为 洪 泛 攻击 ( SYN Flood)。 传 输 控 制 协议 (TCP) 网 络 连接 一 般 
从 “三 次 握手 ”开始 。 首 先 ， 连 接 的 发 起 方 发 送 一 个 包含 SYN 标志 的 数据 包 ， 以 告知 传输 
控制 协议 ， 其 在 启动 一 个 连接 且 接 收 方 应 当 分 配 一 些 缓冲 区 并 复位 连接 相关 的 一 些 数据 字 
段 。 接 收 方 回复 后 ， 发 送 方 会 再 发 送 男 外 一 个 数据 包 来 完成 连接 。 在 洪 泛 攻击 过 程 中 ， 发 送 
方 会 发 送 许 许多 多 的 启动 式 SYN 数据 包 来 不 断 创建 新 的 连接 ,但 是 从 不 对 接收 方 的 回复 加 
以 响应 ， 从 而 消耗 掉 了 大 量 的 内 存 资 源 。 当 足够 数量 的 未 完成 的 连接 被 打开 后 ， 接 收 系统 便 
可 能 会 陷于 瘫痪 ,或 者 仅仅 是 无 法 接受 其 他 的 连接 从 而 拒绝 授权 用 户 的 服务 请 求 。 

这 两 类 问题 在 所 有 当今 的 操作 系统 协议 栈 中 都 已 经 进行 了 修复 ,但 是 它们 可 能 依然 
存在 于 那些 不 容易 升级 的 比较 老式 的 网 络 设 备 中 。 其 他 这 样 的 问题 也 经 常会 被 发 现 ， 并 最 
终 会 得 到 修复 。 如 果 我 们 不 是 接连 不 断 地 去 开发 新 的 协议 ,或 许 这 些 问 题 最 终 都 会 得 到 很 
好 的 解决 。 然 而 ， 其 他 类 型 的 攻击 并 不 是 那么 简单 就 可 以 预防 的 ， 一 个 例子 就 是 采用 僵尸 
(zombie) 的 协同 式 攻击 。 一 个 僵尸 是 指 一 台 安 全 性 已 被 破坏 以 至 于 一 个 远程 用 户 可 以 随意 
运行 未 经 授权 程序 的 机 器 。 假 定 有 一 大 群 僵 己 计算机， 那么 一 个 恶意 用 户 就 可 以 在 同一 时 间 
让 它们 同时 运行 某 一 特定 的 程序 。 由 好 几 万 僵尸 系统 组 成 的 网 络 并 不 稀罕 ， 因 为 好 多 用 户 对 
自己 机 器 的 安全 都 没有 经 验 ， 而 僵尸 机 器 往往 可 能 不 会 表现 出 那些 很 容易 就 可 以 检测 出 来 的 
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症状 。( 僵 尸 机 融 有 时 候 也 被 称 为 机 器 人 ， 一 大 群 的 此 类 机 器 则 被 称 为 僵尸 网 络 .) 相关 程序 
可 能 是 由 合法 的 请 求 组 成 的 一 一 此 类 请 求 有 可 能 是 向 网 站 服务 器 请 求生 成 一 个 特定 的 页 面 ， 
也 可 能 是 一 些 伪造 的 但 从 协议 角度 来 看 是 合法 的 请 求 ， 故 而 很 难 检测 或 者 预防 。 例 如 ， 我 们 
也 许 会 将 一 个 页 面 发 送 到 网 站 服务 器 上 ， 这 通常 只 用 于 维护 的 情景 ， 因 此 大 多 数 的 用 户 并 没 
有 得 到 授权 但 请 求 本 身 看 起 来 却 是 合法 的 。 如 果 数 千 台 僵尸 计算 机 可 以 在 同一 时 间 被 利用 ， 
那么 它们 就 可 能 使 一 台 服 务 器 超载 从 而 使 合法 用 户 被 拒绝 访问 。 即 便 相 关 服 务 器 没有 超载 ， 
服务 器 的 整个 通信 连接 也 可 能 已 被 填 满 ， 故 而 还 是 会 导致 拒绝 服务 。 与 此 同时 ， 因 为 没有 任 
何 单一 的 一 台 僵尸 机 器 看 起 来 处 于 某 种 负荷 之 下 ， 所 以 系统 的 所 有 者 们 可 能 甚至 没有 注意 到 
正在 发 生 的 任何 事情 。 


16.1.6 ”缓冲 区 溢出 

为 了 实施 破坏 活动 ， 病 毒 或 蠕虫 往往 需要 设法 欺骗 系统 基于 管 态 ( supervisor mode， 也 
称 为 管理 程序 模式 ) 去 运行 有 关 的 恶意 代码 。 病 毒 或 蜂 虫 驾驭 这 项 技艺 的 一 种 最 常见 的 方法 
就 是 利用 一 种 称 为 缓冲 区 溢出 ( buffer overflow 或 buffer overrun) 的 程序 编码 错误 。 我 们 所 
提 到 的 死 拼 攻击 就 是 属于 此 类 的 一 个 例子 。 当 进程 存储 数据 超出 缓冲 区 未 端 时 ， 就 会 发 生 组 
冲 区 溢出 。 在 这 种 情况 下 ， 多 余 的 数据 将 会 覆盖 邻近 的 内 存 区 域 。 缓 冲 区 溢出 可 能 会 导致 进 
程 骨 省 或 者 输出 错误 的 信息 。 它 们 可 能 是 由 蓄意 设计 的 输入 而 触发 的 ， 或 者 试图 去 运行 恶意 
代码 , 或 者 只 是 通过 改变 数据 来 使 程序 以 一 种 并 非 计 划 中 的 方式 运行 。 缓 冲 区 溢出 是 许多 软 
件 脆 弱 性 的 起 因 ， 同 时 也 是 许多 恶意 攻击 的 基础 。 边 界 检查 〈bound checking) 可 以 预防 组 
冲 区 溢出 。 然 而 ,程序 设计 人 员 通 常 并 不 会 考虑 这 些 问 题 ， 而 只 是 天 真 地 假设 有 关 的 输入 数 
据 都 是 正确 的 。 编 译 器 可 以 生成 始终 执行 边界 检查 的 代码 ,但 是 程序 设计 人 员 出 于 效率 的 考 
量 往往 会 关闭 此 类 编译 选项 。 

在 下 面 的 例子 中 , X 是 当 程 序 开始 执行 时 内 存 中 的 某 项 数据 ， 而 了 则 恰巧 在 它 的 毗邻 区 
域 。 二 者 目前 都 是 0。 





如 果 程 序 试图 把 字符 串 “ too much ”存储 到 半 中 ， 则 其 将 会 导致 缓冲 区 (XX) 溢出 ,并 
破坏 掉 变 量 了 的 取 值 。 





虽然 程序 设计 人 员 根 本 就 没有 打算 改变 了 的 取 值 ， 但 是 ,了 的 取 值 现在 已 经 由 相关 字符 串 的 
一 部 分 所 形成 的 一 个 数 蔡 代 掉 了 。 在 这 个 例子 中 ， 即 采用 ASCII ( American Standard Code 
for Information Interchange， 美 国信 息 交 换 标准 代码 ) 编码 的 大 端 字 节 序 的 (big-endian， 即 
高 位 优先 的 ) 系统 中 ,“h” 跟 上 一 个 内 容 为 零 的 字 节 将 会 是 数 26624 ( 译 者 注 : 字符 “h” 
的 ASCII 码 为 0x68， 于 是 二 者 合 到 一 起 就 是 十 六 进 制 数 0x6800， 对 应 十 进 制 数 即 26624 ) 。 
因此 ， 写 入 一 个 很 长 的 字符 串 将 可 能 导致 诸如 分 段 故 障 、 进 程 崩 演 之 类 的 错误 。 

用 来 开发 缓冲 区 溢出 的 相关 方法 根据 计算 机 体系 结构 、 操 作 系统 和 存储 区 域 的 不 同 而 有 
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所 变化 。 除 了 用 于 改变 不 相关 变量 的 取 值 ， 绥 冲 区 溢出 经 常 被 攻击 者 用 来 欺诈 程序 去 执行 来 B64] 
自 于 蓄意 设计 的 输入 所 导向 的 那些 随心 所 和 欲 而 设计 的 恶意 代码 。 攻 击 者 用 来 获取 控制 的 这 项 
技术 依赖 于 缓冲 区 所 处 的 内 存 区 域 。 例 如 ,缓冲 区 可 能 是 在 堆栈 区 域 ， 有 关 数 据 会 先 压 到 堆 
栈 上 ， 然 后 再 弹出 来 。 不 过 ， 也 存在 利用 堆 溢 出 (heap overflow) 的 情况 。 

通常 情况 下 ， 当 一 个 函数 开始 执行 时 ， 局 部 变量 被 压 到 堆栈 上 ， 并 且 只 有 在 执行 该 函数 
的 过 程 中 才能 被 访问 。 这 便 存 在 一 个 问题 ， 因 为 在 大 多 数 系统 中 ,堆栈 还 会 保存 返回 地 址 ， 
即 在 当前 函数 被 调用 之 前 程序 正在 执行 的 位 置 。 当 该 函数 结束 时 ， 执 行 会 跳 转 到 返回 地 址 。 
如 果 返 回 地 址 被 一 个 缓冲 区 溢出 所 覆盖 ， 其 将 会 指向 其 他 位 置 。 对 于 第 一 个 例子 里 所 出 现 的 
偶发 性 缓冲 区 溢出 情况 ， 其 几乎 肯定 会 是 一 个 无 效 的 位 置 ， 即 不 会 包含 任何 程序 指令 ， 故 而 
对 应 进程 将 会 崩溃 。 但 是 ， 通 过 仔细 地 分 析 研 究 一 个 系统 中 的 代码 ， 攻 击 者 就 可 以 巧妙 地 规 
划 相 关 执 行 流程 ， 从 而 使 系统 开始 执行 有 关 的 攻击 代码 。 当 前 ， 现 代 的 操作 系统 已 开始 通过 
在 逻辑 地 址 空间 随机 分 布 代 码 和 数据 位 置 的 方法 来 增加 实施 此 类 攻击 行为 的 难度 。 


16.1.7 脚本 和 小 应 用 程序 


男 一 类 型 的 恶意 软件 变种 有 时 会 在 恶意 网 站 中 找到 。 一 些 机 制 不 断 演化 发 展 ， 使 得 一 个 
网 站 可 以 向 客户 端 系 统 发 送 程 序 。 这 些 机 制 包 括 脚 本 语言 ， 壁 如 JavaScript、VBScript， 以 
及 旨 在 软件 虚拟 机 上 运行 的 小 应 用 程序 ( applet， 有 时 也 简称 为 小 程序 )， 相 关 虚 拟 机 如 太阳 
微 系 统 公司 (Sun Microsystems) 的 Java 虚拟 机 (Java virtual machine，JVM) 和 微软 公司 的 通 
用 语言 运行 库 (Common Language Runtime，CLR)。 这 两 种 机 制 通常 需要 以 一 种 称 为 沙 箱 
( sandbox) 的 方式 在 浏览 器 内 部 执行 程序 ， 如 图 16-1 所 示 。 这 便 意味 着 相关 程序 的 活动 是 受 
到 限制 的 ， 故 而 它们 本 来 应 该 不 会 造成 危害 。 例 如 ， 通 常 在 浏览 器 中 运行 的 程序 是 不 允许 访 
问 本 地 磁盘 驱动 器 的 。 然 而 ， 大 多 数 的 浏览 器 都 允许 用 户 去 撤销 相关 限制 ， 从 而 使 一 个 可 信 
程序 可 以 去 做 一 些 事情 ， 而 这 样 的 事情 我 们 可 能 不 会 让 一 个 我 们 并 不 放心 的 程序 去 做 。 如 果 
我 们 是 从 我 们 自己 的 公司 网 站 得 到 的 小 应 用 程序 ， 我 们 很 可 能 就 会 信任 它们 。 而 如 果 小 应 用 
程序 来 自 于 其 他 地 方 ， 我 们 可 能 就 不 会 信任 。 





客户 端 系统 服务 端 系统 
图 16-1 沙 箱 执行 模型 365 


小 型 文本 文件 ( cookie) 是 另外 一 种 被 普遍 认为 会 引发 安全 问题 的 机 制 。 根 据 设 计 ， 网 





站 服务 器 是 无 状态 的 一 一 它们 并 不 会 保留 关于 各 客户 端的 任何 信息 。( 在 网 站 服务 器 上 运行 
的 应 用 程序 会 这 样 做 ,但 这 并 不 是 服务 器 本 身 的 一 项 功能 或 特性 。) 这 种 无 状态 的 性 质 限 制 
了 服务 器 可 以 完成 的 事情 。 为 了 扩展 相关 功能 ， 浏 览 器 进行 了 功能 增强 以 允许 一 个 服务 器 记 
录 关 于 在 浏览 右 系 统 上 的 一 个 网 站 的 信息 。 这 些 都 是 比较 短小 的 文本 字符 串 。 当 一 个 浏览 器 
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请 求 页 面 时 ， 服 务 器 就 可 以 读 取 这 些小 型 文本 文件 。 它 们 将 有 助 于 使 服务 器 看 起 来 好 像 是 有 
状态 的 。 它 们 可 以 存储 客户 编码 、 所 提出 的 最 后 一 个 问题 、 所 访问 的 最 后 一 个 页 面 、 购 物 车 
信息 ， 等 等 。 当 你 在 某 网 站 的 页 面 之 间 进 行 跳 转 切换 时 ， 它 们 可 以 用 来 暂时 性 告知 该 网 站 你 
已 经 登录 过 了 。 需 要 指出 的 是 ， 人 们 常常 会 认为 这 些小 型 文本 文件 可 能 包含 有 病毒 或 其 他 恶 
意 软件 ,但 这 仅仅 是 一 种 错觉 或 误解 。 其 间 ， 跟 踪 式 小 型 文本 文件 (tracking cookie) 可 能 出 
于 广告 目的 而 构造 成 是 跨越 多 个 网 站 进行 信息 共享 的 ， 但 是 它们 无 法 、 也 不 可 能 去 损害 一 台 
计算 机 或 者 计算 机 上 的 其 他 信息 或 程序 。 


16.2 操作 系统 保护 
16.2.1 保护 

在 前 面 的 章节 中 ， 我 们 曾 从 若干 不 同 的 角度 讨论 过 操作 系统 保护 ， 但 是 在 这 里 有 必要 再 
次 提 到 相关 内 容 。 其 中 的 一 个 例子 如 用 于 运行 操作 系统 的 管理 程序 模式 ( supervisor mode， 
也 称 为 管 态 ) 和 用 于 运行 应 用 程序 的 用 户 模式 〈user mode， 也 称 为 目 态 ) 之 间 的 分 离 机 制 。 
这 种 分 离 机制 允 许 操作 系统 监控 各 种 类 型 的 操作 ， 以 确保 它们 不 会 去 做 任何 引发 灾难 的 事 
情 。 例 如 ， 操 作 系 统 有 可 能 要 确认 一 项 输入 /输出 请 求 不 会 覆盖 文件 系统 的 元 数据 部 分 。 然 
而 ， 在 许多 情况 下 ， 这 并 不 能 防止 某 些 滥用 行为 ， 例 如 ， 某 个 用 户 可 能 会 让 系统 去 删除 自己 
希望 删除 的 某 个 文件 。 不 过 ， 一 些 这 样 的 滥用 可 以 通过 我 们 将 会 在 下 面 展 开 进一步 讨论 的 文 
件 系统 保护 机 制 来 加 以 减缓 。 

类 似 地 ， 操 作 系 统 通过 启用 一 个 计时 器 ( timer) 来 保护 处 理 器 的 使 用 ， 并 且 防 止 用 户 程 
序 改 变 该 计时 器 。 这 将 允许 操作 系统 中 止 任何 陷入 死 循环 的 程序 ， 而 不 管 其 是 否 是 有 意 这 样 
设计 的 。 在 批 处 理 系统 中 ， 当 启动 一 道 程 序 时 ， 往 往 会 给 出 一 个 相应 估算 的 运行 时 间 ， 并且 
如 果 该 程序 运行 时 间 超 过 对 应 运行 时 间 估 值 一 定 百 分 比 ， 那 么 将 会 中 止 该 程序 。 在 交互 式 系 
统 中 ， 相 关 情 况 往往 假定 用 户 最 终 会 中 止 操作 ， 并 且 或 者 重新 尝试 ， 或 者 去 做 其 他 事情 。 无 
论 哪 一 种 情况 ， 一 个 流 谍 程序 (rogue program) 都 不 能 完全 阻塞 相应 系统 ， 因 为 操作 系统 可 
能 是 多 任务 的 ， 同 时 ， 用 户 还 可 以 利用 与 操作 系统 之 间 的 交互 终止 一 个 死 循环 程序 。 

内 存 保护 是 操作 系统 保护 的 最 后 一 个 方面 。 硬 件 通常 可 以 检查 逻辑 地 址 空间 (logical 
address space) 的 寻 址 范围 。 此 外 ， 许 多 系统 可 以 把 某 些 页 面 标记 为 允许 只 读 访 问 的 或 者 是 
只 执行 访问 的 ， 从 而 又 增加 了 一 种 保护 措施 。 这 些 功 能 允许 操作 系统 保护 自身 不 受 任何 用 户 
程序 的 侵犯 ， 同 时 还 可 以 防止 程序 彼此 之 间 相 互 干 扰 。 


16.2.2 ”认证 


当 用 户 远程 访问 计算 机 系统 时 ， 我 们 可 能 会 关心 他 们 只 可 以 访问 那些 我 们 想 让 他 们 访 
问 的 资源 ， 尽 管 有 些 时 候 我 们 并 不 介意 他 们 访问 了 什么 。 例 如 ， 大 多 数 的 网 站 服务 器 ， 基 本 
上 都 会 允许 任何 用 户 去 访问 任何 页 面 。 然而， 通过 网 站 接口 进行 访问 的 网 上 银行 系统 肯定 不 
想 让 任何 用 户 都 可 以 访问 服务 器 上 的 所 有 信息 。 我 们 希望 用 户 只 可 以 访问 他 们 被 授权 访问 的 
账户 。 实 际 上 ， 用 来 控制 用 户 可 以 访问 系统 上 哪些 东西 的 相关 机 制 包 括 两 个 部 分 ， 即 认证 
(authentication) 与 授权 (authorization)。 认 证 是 去 验证 通信 的 一 方 的 身份 。 在 用 户 访问 银行 
账户 的 案例 中 ， 我 们 需要 验证 双方 的 身份 。 银 行 希望 对 用 户 进 行 身份 认证 ， 这 是 显而易见 
的 。 然 而 ， 直 到 现在 ， 相 反方 向 的 身份 认证 一 一 也 就 是 说 ， 在 使 用 网 上 银行 系统 时 ， 我 们 也 
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想 要 对 银行 进行 认证 一 一 却 并 不 那么 明显 。 一 类 新 的 计算 机 欺诈 已 经 出 现 ， 被 称 为 网 络 钓鱼 
( phishing)。 在 大 多 数 情况 下 ， 网 络 钓 鱼 诈 骗 都 是 通过 电子 邮件 发 送 的 。 它 试 图 引导 用 户 去 
访问 一 个 网 站 ， 而 这 个 网 站 被 伪装 成 壁 如 你 的 银行 之 类 的 网 站 。 然 后 ， 它 会 诱 使 你 去 输入 一 
些 机 密 信息 ， 如 你 的 信用 卡号 码 或 者 银行 账户 号 码 ， 以 及 用 户 名 和 密码 。 它 会 使 用 一 些 看 似 
合理 的 冠冕 堂皇 的 理由 来 向 你 索要 这 些 信息 ， 比 如 ， 常 常会 声称 需要 对 你 的 身份 进行 认证 ， 
而 且 通 常会 强调 ， 是 因为 系统 安全 在 某 些 方面 遭受 了 破坏 ， 所 以 系统 才 需 要 这 些 信息 。 鉴 于 
此 ,我们 现在 已 经 明白 ， 与 向 主机 系统 验证 客户 端的 身份 一 样 ， 向 客户 端 进行 主机 系统 的 身 
份 验 证 也 是 十 分 重要 的 。 

身份 认证 一 般 会 采取 如 下 三 种 形式 中 的 一 种 : 你 所 持 有 的 、 你 所 知道 的 或 者 你 所 特有 
的 ( 即 你 的 个 人 特征 )。 关 于 你 所 持 有 的 ， 具 体例 子 如 你 的 银行 卡 或 者 你 的 家 门 钥匙 ， 但 
是 卡 和 钥匙 都 有 可 能 被 偷 走 。 关 于 你 所 知道 的 ， 有 具体 例子 如 你 的 登录 账号 和 密码 ， 或 者 你 
的 账户 号 码 ， 但 如 果 你 在 输入 时 被 第 三 方 看 见 或 者 如 果 第 三 方 从 通信 线路 上 读 取 到 相关 消 
息 ， 这 些 信息 就 有 可 能 被 截获 和 泄露 。 关 于 你 所 特有 的 ， 具体 可 能 是 声 纹 (voiceprint)、 指 
纹 (thumbprint) 或 者 视网膜 扫描 (retinal scan)， 此 类 系统 现在 刚刚 投入 使 用 ， 从 理论 上 来 
讲 , 一 旦 它们 得 到 进一步 的 发 展 ， 系 统 将 会 更 难以 欺骗 从 而 认证 结果 会 更 为 可 信 。 同 时 采用 
两 种 不 同 的 认证 方法 称 为 双 因 素 身份 认证 (two-factor authentication ， 或 称 为 双重 身份 认证 )， 
举例 来 说 ， 当 一 个 人 使 用 银行 卡 时 ， 还 必须 同时 提供 个 人 身份 号 码 ( Personal Identification 
Number，PIN )。 

鉴于 社会 因素 ， 密 码 是 有 问题 的 。 最 糟糕 的 密码 是 有 时 随 软件 或 硬件 而 配备 的 默认 密 
马 。 令 人 惊讶 的 是 ， 通 常情 况 下 这 些 密码 从 来 不 做 修改 。 而 如 果 密 码 选择 地 不 够 小 心 ， 那 么 
密码 也 很 容易 就 会 被 猜 到 。 这 样 的 密码 被 认为 是 弱 强 度 的 。 前 面 提 到 的 互联 网 蠕虫 曾 使 用 
了 若干 猜测 密码 的 机 制 ， 并 且 取 得 了 显著 的 成 功 。 所 以 ， 我 们 建议 采用 高 强度 密码 (strong 
password)。 一 般 来 说 ， 如 果 密 码 包 含有 大 写 和 小 写字 母 、 符 号 以 及 数字 的 组 合 ， 并 且 不 包 
含 任何 名 字 、 单 词 、 重 复 符号 或 者 序列 (譬如 123 或 tuv)， 那 么 这 样 的 密码 就 被 认为 是 高 强 
度 的 。 由 名 字 或 单词 组 成 的 密码 往往 通过 猜测 常见 的 单词 或 者 与 对 应 账户 相关 联 的 名 字 就 可 
以 破译 出 来 ， 称 之 为 字典 式 攻 击 ( dictionary attack) 。 不 过 ， 高 强度 密码 存在 的 问题 是 它们 
很 难 被 记 住 。 特 别 地 ， 我 们 常常 被 建议 在 不 同 的 系统 中 不 要 使 用 相同 的 密码 ， 这 便 加 剧 了 
此 类 问题 。 于 是 ， 这 些 高 强度 密码 经 常 可 以 在 计算 机 显示 器 上 粘贴 的 便签 上 面 发 现 ， 从 而 
严重 影响 了 它们 的 有 效 性 。 一 个 不 错 的 技巧 是 构造 一 个 句子 ， 并 使 用 每 个 单词 的 首 字母 即 
采用 首 字母 缩写 方式 来 构造 密码 。 例 如 ， 由 “ World War 2 began in 1939!”( 译 者 注 : 寓意 
第 二 次 世界 大 战 开始 于 1939 年 ) 可 以 生成 一 个 密码 “WW2bi1939!”。 这 是 一 个 非常 漂亮 的 
高 强度 密码 。 当 你 试图 使 用 这 个 密码 时 ， 你 可 能 记 不 清楚 是 哪 一 年 了 ， 没 关系! 登录 谷歌 
(Google) 网 站 ,输入 “year wwii started.” 以 查询 “二 战 是 哪 年 开始 的 ?” 就 可 以 了 。 现 在 ， 
你 的 便 得 上 还 可 以 写 上 一 些 仅 对 你 自己 才 有 意义 的 ( 即 只 有 你 才能 看 懂 的 ) 神秘 上 暗示， 比如 
说 “W2”。 


16.2.3 ”授权 


一 旦 操作 系统 知道 了 用 户 是 谁 ， 下 一 项 任务 就 是 要 确定 对 应 用 户 可 以 执行 什么 样 的 操 
作 。 更 具体 地 来 说 ， 所 允许 的 操作 取决 于 正在 访问 的 对 象 一 一 对 于 一 台 计 算 机 上 的 所 有 文件 
而 言 ， 我 们 通常 不 会 拥有 相同 的 权限 。 我 们 一 直 以 来 是 把 一 个 用 户 作为 一 个 人 来 进行 讨论 
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的 , 但 是 ,在 操作 系统 的 上 下 文中 ,一 个 进程 同样 可 以 被 认为 是 一 个 用 户 。 决 定 一 个 用 户 可 
以 针对 一 个 对 象 ( 比 如 文件 ) 执行 什么 操作 的 过 程 称 为 授权 ( authorization)。 从 理论 上 讲 ， 
操作 系统 可 能 拥有 一 个 称 为 访问 控制 矩阵 ( Access Control Matrix，ACM) 的 数据 表格 。 该 
矩阵 的 一 个 维度 可 以 是 用 户 ， 而 另 一 个 维度 则 是 被 操作 的 对 象 。 和 矩阵 单元 格 中 的 项 则 说 明了 
允许 对 应 用 户 针对 相应 对 象 可 以 实施 的 操作 。 图 16-2 展示 了 一 个 假想 的 访问 控制 矩阵 。 其 
中 ， 我 们 可 以 看 到 各 行 标 上 了 一 些 用 户 名 ， 而 各 列 则 标 以 若干 对 象 名 。 在 这 个 例子 里 ， 我 们 
可 以 看 到 有 三 个 文件 对 象 与 一 个 打印 机 对 象 。 温 迪 ( Wendy) 是 美 编 部 的 设计 人 员 ， 被 授权 
使 用 激光 打印 机 ， 但 不 能 使 用 gcc 编译 器 ( GNU Compiler Collection，gcc， 也 称 为 GNU 编 
译 器 套件 )。 安 (Ann) 和 弗 兰 德 (Fred) 均 可 以 阅读 和 编写 自己 的 简历 ， 而 任何 其 他 人 员 均 
不 能 阅读 和 写 操作 安 和 弗 兰 德 的 简历 。 同 时 ， 安 和 弗 兰 德 都 能 够 执行 gce 编译 器 ， 但 是 他 们 
都 不 可 以 将 gcc 作为 数据 读 人 ， 也 不 可 以 写 操作 gcc。 注 意 ， 针 对 一 个 对 象 的 可 接受 的 操作 
集 有 可 能 与 针对 一 种 不 同类 型 的 另 一 个 对 象 的 可 接受 的 操作 集 并 不 一 样 。 例 如 ， 打 印 机 可 能 
支持 停止 队列 的 操作 ， 而 一 个 文件 则 不 会 支持 停止 队列 的 操作 。 


安 的 。” ” 弗 雷 德 的 gcc 激光 
简历 文件 简历 文件 “编译 器 打印 机 











写 / 
温 迪 总 停止 队列 / 
， 开始 队列 
图 16-2 ”访问 控制 矩阵 示例 


即便 是 从 这 一 小 部 分 的 访问 控制 矩阵 也 可 以 清晰 地 看 到 ， 访 问 控制 矩阵 中 大 部 分 的 单 
元 格 都 是 空 的 。 试 图 保存 整个 访问 控制 矩阵 将 会 浪费 掉 大 量 的 内 存 。 一 台大 型 机 器 可 能 拥有 
成 千 上 万 的 用 户 和 无 以 计数 的 文件 ， 并 且 大 多 数 的 用 户 只 允许 访问 很 少 的 一 部 分 文件 。 鉴 于 
这 个 原因 ， 操 作 系 统一 般 并 不 采用 访问 控制 矩阵 ， 而 是 会 采用 访问 控制 表 或 者 权限 表 。 访 问 
控制 表 ( Access Control List，ACL ) 附着 在 一 个 对 象 上 ， 并 且 仅 仅 包含 被 授权 针对 该 对 象 执 
行 操作 的 用 户 。 访 问 控制 表 的 表 项 将 会 列 出 每 个 可 以 访问 对 应 对 象 的 特定 用 户 以 及 他 们 针对 
这 个 对 象 可 以 执行 的 操作 。 图 16-3 给 出 了 对 应 于 图 16-2 中 访问 控制 矩阵 的 一 些 访 问 控制 表 
( 译 者 注 : 确切 地 说 ， 是 三 张 访问 控制 表 ， 分别 附着 在 安 的 简历 文件 、gec 编译 器 及 激光 打印 
机 等 三 个 对 象 上 )。 








图 16-3 ”对 应 于 图 16-2 中 访问 控制 矩阵 的 一 些 访问 控制 表 
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另外 ， 操 作 系 统 也 可 以 采用 权限 表 ( Capability List，CL)。 图 16-4 显示 了 与 图 16-2 中 
访问 控制 矩阵 相 匹配 的 一 些 权 限 表 ( 译 者 注 : 安 的 
原文 为 A CL， 即 一 张 权限 表 ， 应 为 笔 误 。 确 简历 文件 -编译 器 
切 地 说 ， 具 体 给 出 了 两 张 权限 表 ， 分 别 对 应 


安 | ” 读 / 写 执行 
于 安 及 温 迪 两 个 用 户 )。 权 限 表 的 表 项 给 出 了 
一 个 用 户 被 授权 操作 的 各 个 对 象 以 及 该 用 户 
针对 各 对 象 被 授权 执行 的 操作 列表 。 本 
尽管 如 此 ， 按 照 我 们 已 经 展示 的 方式 来 | | 
创建 这 些 表格 中 的 表 项 ， 所 创建 的 引用 数 还 


会 远 远 多 于 我 们 可 能 喜欢 的 数量 。 具 体 而 ”图 16-4 对 应 于 图 16-2 中 访问 控制 矩阵 的 一 些 
言 ， 以 一 所 规模 较 大 的 综合 性 大 学 的 学 生 访 权限 表 
问 一 台 计算 机 上 的 通用 系统 实用 例 程 的 权限 设置 的 问题 为 例 ， 不 仅 有 成 千 上 万 甚至 数 万 的 
学 生 ， 而 且 每 个 学 期 的 学 生 都 在 发 生变 化 一 一 有 的 加 入 ,而 有 的 离开 ,无论 以 何 种 方式 。 
为 每 一 名 学 生 设 定 所 有 必要 的 权限 是 一 项 重大 的 行政 问题 。 然 而 ， 我 们 常常 也 会 采用 分 组 
( group) 或 角色 (role) 的 授权 方式 。 我 们 可 以 创建 一 个 称 作 “学 生 ” 的 组 别 ， 并 为 该 组 分 配 
针对 相关 必要 对 象 的 访问 权限 。 在 此 基础 上 ， 当 学 生 到 来 或 者 离开 时 ， 管 理 人 员 所 需 完成 的 
事情 就 是 把 新 的 学 生 加 入 这 个 组 里 面 以 及 把 那些 不 再 拥有 访问 权限 的 学 生 从 组 里 移 除 到 外 
面 。 赋 予 该 组 的 访问 权限 可 以 由 学 生 继承 下 来 。 角 色 授 权 方 式 是 类 似 的 ,其 允许 我 们 在 系统 
中 拥有 一 个 用 户 ， 并 为 这 个 用 户 分 配 一 个 角色 。 一 个 角色 可 能 对 应 于 特定 项 目 组 里 的 某 个 成 
员 。 该 项 目 组 成 员 所 对 应 的 所 有 用 户 应 继承 该 项 目 组 所 共享 的 一 组 对 象 的 一 系列 访问 权限 。 
当 有 成 员 离开 这 个 项 目 组 而 进入 另 一 个 项 目 组 时 ， 管 理 人 员 所 需 完 成 的 事情 就 是 改变 他 们 的 
角色 ， 进 而 他 们 所 有 的 访问 权限 也 将 随 之 发 生 改 变 。 

一 个 必须 要 回答 的 问题 是 ,授权 应 当 在 什么 时 候 进 行 检 查 。 一 种 选择 是 当 一 个 对 象 被 
第 一 次 访问 〈 例 如 ， 一 个 文件 被 打开 ， 一 个 套 接 字 连接 被 创建 ， 一 个 特定 的 打印 机 被 假 脱 机 
系统 所 请 求 ) 时 ， 就 去 检查 相应 授权 情况 。 在 此 之 后 ， 最 初 的 访问 所 包含 的 一 组 操作 类 型 将 
不 再 进行 另外 的 检查 而 直接 准予 执行 。 例 如 ， 如 果 我 们 打开 了 一 个 文件 用 于 输入 ,那么 这 个 
文件 将 被 允许 读 操作 ， 但 不 允许 写 操 作 。 根 据 操作 系统 所 需 的 安全 级 别 ， 我 们 可 能 会 觉得 这 
是 不 够 的 。 我 们 可 能 会 要 求 每 一 个 独立 的 操作 都 应 当 对 照相 关 访 问 控制 表 或 权限 表 进 行 专门 
的 检查 一 一 因为 说 不 准 在 最 初 的 访问 过 后 ， 用 户 的 相关 权限 可 能 已 经 被 撤销 了 。 例 如 ， 某 用 
户 即 将 被 解雇 ， 而 他 自己 发 现 了 这 一 情况 ， 故 而 开始 改写 操作 系统 上 的 文件 以 试图 消除 其 污 
职 的 证 据 。 虽 然 管理 人 员 废 除了 该 用 户 的 密码 ,但 是 相关 操作 已 经 在 进行 中 了 。 对 于 此 类 问 
题 ， 我 们 将 会 在 安全 级 别 相关 主题 中 深入 展开 讨论 。 请 注意 ， 这 是 操作 系统 设计 人 员 必 须要 
决定 的 ， 即 是 否 需 要 在 操作 系统 中 提供 相应 机 制 来 支持 有 关 的 授权 检查 功能 ， 同 时 ， 系 统管 
理 人 员 也 必须 要 决定 是 否 调 用 相关 功能 。 对 于 百货 公司 而 言 ， 此 类 安全 机 制 无 论 对 系统 本 身 
还 是 对 于 维护 行政 成 本 来 说 都 是 不 值得 的 。 但 是 ， 对 于 银行 而 言 ， 则 完全 是 另外 一 码 事 。 

另外 ， 还 有 一 个 问题 ， 就 是 授权 应 当 在 什么 级 别 上 实施 。 通 常情 况 下 ， 系 统 中 的 对 象 
会 组 织 成 一 个 或 多 个 树 形 结构 ， 璧 如， 硬盘 驱动 器 上 的 文件 系统 就 是 一 个 例子 。 我 们 往往 授 
权 一 个 用 户 可 以 访问 一 个 特定 的 主 目录 (home directory)。 这 意味 着 ， 针 对 一 个 目录 的 访问 
权限 将 会 自然 延伸 到 其 子 目 录 上 ， 除 非 相 关 权限 被 重新 设 定 。 一 般 而 言 ， 我 们 也 可 能 会 对 一 
个 目录 下 的 任意 文件 的 访问 权限 进行 重新 设 定 。 在 某 些 系统 中 ， 我 们 还 可 能 针对 数据 库 的 各 
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个 部 分 (有 时 候 是 针对 一 组 字段 ) 分 别 进行 权限 设 定 。 为 此 ， 人 力 资源 ( Human Resource， 
HR) 部 的 一 名 办 事 的 工作 人 员 或 许 能 够 看 到 所 有 员工 的 家 庭 联络 信息 ， 但 却 看 不 到 他 们 的 
工资 信息 。 有 时 ， 这 种 限制 可 能 是 针对 一 组 取 值 (譬如 一 组 记录 ) 来 展开 的 。 于 是 ， 一 名 负 
责 薪 资 的 办 事 员 或 许 能 够 访问 大 多 数 员工 的 工资 记录 ， 但 其 中 不 包括 那些 位 阶 在 某 一 管理 级 
别 以 上 的 员工 。 再 次 强调 ， 操 作 系统 设计 人 员 必 须 决定 是 否 提供 相应 机 制 ， 而 管理 人 员 必 须 
设 定 关于 这 些 机 制 使 用 的 相关 策略 。 


16.3 策略、 机制 和 技术 


有 许多 类 型 的 安全 机 制 ， 它 们 通常 在 大 多 数 较 大 型 的 操作 系统 中 都 可 以 找到 。 在 本 节 
中 ， 我 们 将 会 介绍 其 中 的 几 种 常见 机 制 。 但 在 我 们 考虑 相关 机 制 之 前 ， 首 先 制 定 相应 的 策略 
是 非常 重要 的 ， 也 就 是 说 应 当 毫 不 含糊 地 确定 用 户 可 以 做 什么 、 不 可 以 做 什么 以 及 他 们 必须 
做 什么 。 


16.3.1 安全 与 保护 策略 


任何 试图 成 为 安全 的 网 络 都 必须 拥有 一 系列 明确 说 明 如 下 事项 的 策略 : 

e 什么 是 准许 用 户 做 的 。 

。 什么 是 不 允许 用 户 做 的 。 

e 什么 是 要 求 用 户 做 的 。 

e 而 如 果 相 关 规 程 未 被 遵循 ， 相 应 的 惩罚 又 会 是 什么 。 

即便 是 在 家 庭 环境 中 ， 如 果 家 长 希望 限制 孩子 访问 某 些 类 型 的 网 站 ， 那 么 他 们 应 当 清楚 
地 说 明 是 什么 样 的 具体 限制 。 防 火 墙 机 制 并 不 完善 ， 很 有 可 能 家 庭 中 的 孩子 最 终 会 比 他 们 的 
父母 更 懂 计 算 机 和 具有 更 强 的 计算 机 操控 能 力 ， 故 而 能 够 成 功 跨越 许多 安全 机 制 。 为 此 ， 应 
当 事 先 确定 和 声明 ， 如 果 做 了 那些 被 禁止 的 事情 将 会 受到 怎样 的 惩罚 。 如 果 没 有 提前 清楚 地 
说 明 相关 限制 ， 即 便 是 要 解雇 一 个 发 送 了 威胁 邮件 的 职员 都 是 十 分 困难 的 。 

同样 ,员工 必须 明确 地 被 告知 ， 就 备份 信息 、 某 些 环境 采用 加 密 措施 、 保 护 他们 的 计算 
机 等 事项 而 言 ， 他 们 的 具体 职责 是 什么 。 如 果 让 他 们 去 运行 病毒 检查 程序 和 防火 墙 并 且 保持 
软件 更 新 ， 那 么 他 们 应 当 被 提前 告知 ， 如 果 他 们 不 这 样 做 ， 将 可 能 发 生 什么 样 的 问题 ， 而 不 
遵守 相关 策略 将 会 受到 什么 样 的 惩罚 。 


16.3.2 系统 崩溃 保护 : 备份 


鉴于 有 时 会 发 生 系统 崩溃 ， 所 以 操作 系统 必须 提供 相应 的 处 理 机 制 ， 即 系统 骨 溃 保护 
(crash protection)。 首 先 ， 运 行 的 系统 可 能 会 出 现 崩 演 。 尽 管 操作 系统 同 以 前 比较 起 来 要 好 
多 了 ,但 是 没有 任何 一 个 重要 的 程序 是 真正 调试 过 的 。 当 系统 崩 演 时 ， 我 们 必须 能 够 从 相 
关系 统 骨 省 困 境 中 恢复 过 来 。 我 们 已 经 讨论 过 一 些 处 理 相应 崩溃 的 机 制 。 事 务 (transaction) 
是 其 中 的 第 一 项 机 制 。 通 常情 况 下 ， 我 们 会 采取 一 系列 的 关于 文件 或 者 数据 库 的 更 新 操作 ， 
它们 协同 工作 并 可 共同 定义 为 一 项 事务 。 我 们 可 能 正在 把 一 件 昂 贵 的 器 材 从 一 个 仓库 转移 到 
另 一 个 仓库 。 如 果 我 们 采用 的 是 单独 的 文件 或 数据 库 ， 那 么 其 中 一 项 更 新 操作 需要 反映 该 器 
材 离开 了 这 个 仓库 ， 同 时 另 一 项 更 新 操作 需要 反映 该 器 材 现 在 放 在 了 另 一 个 仓库 中 。 如 果 系 
统 是 在 其 中 的 一 项 更 新 操作 完成 之 前 就 月 溃 了 ， 那 么 我 们 要 么 将 会 失去 该 器 材 的 所 有 线索 ， 
要 么 会 以 为 我 们 所 拥有 的 器 材 数 量 比 我 们 实际 所 拥有 的 器 材 数量 要 多 一 个 。 通 过 把 这 些 更 新 
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操作 捆绑 成 为 单一 的 一 项 事务 ， 系 统 就 可 以 确保 这 两 项 更 新 操作 要 么 全 部 完成 ， 要么 哪 一 项 
都 不 做 。 我 们 主要 通过 日 志 ( logging)、 检 查 点 ( checkpoint) 和 回 滚 (rollback) 等 方法 来 实 
现 相 关 事务 机 制 。 

数据 丢失 的 另 一 个 可 能 的 根源 在 于 磁盘 驱动 器 的 物理 崩溃 。 有 时 候 ， 磁 盘 上 的 读 写 磁头 
会 实 实在 在 地 划 损 盘 片 ， 从 而 擦 掉 盘 片 涂 层 。 男 外 一 些 时 候 ， 我们 也 有 可 能 遇 到 轴承 或 者 电 
子 故 障 。 尽 管 有 些 时 候 从 出 现 故障 的 磁盘 驱动 器 上 也 有 可 能 恢复 一 些 甚至 全 部 数据 ， 但 这 件 
事情 肯定 是 代价 十 分 昂贵 并 且 非 常 耗费 时 间 的 。 一 种 应 对 这 种 可 能 性 的 更 好 的 办 法 是 把 相关 
数据 备份 到 可 移动 介质 上 。 从 历史 上 来 看 ， 因 为 磁带 的 成 本 比较 低 ， 所 以 这 种 备份 往往 是 把 
相关 数据 复制 到 磁带 上 。 对 于 小 型 系统 ， 则 常常 使 用 软盘 或 者 稍 高 容量 的 相关 产品 来 进行 备 


份 。 今天, 个 人 计算 机 备份 ( backup) 最 常 使 用 的 是 光盘 (Compact Disk，CD) 或 数字 化 视 . 


频 光 盘 ( Digital Video Disk，DVD)。 不仅 磁 盘 驱 动 器 会 发 生 朋 湿 问 题 ， 用 户 有 时 候 也 会 引 
发 “崩溃 ”事件 。 每 一 个 系统 管理 员 已 经 习惯 于 听 到 有 用 户 删除 了 一 个 的 的 确 确 所 需要 的 文 
件 ， 并 且 对 应 用 户 非常 恳切 地 请 求 系统 管理 员 帮 忙 恢复 相关 文件 。 因 此 ， 备 份 同样 是 值得 去 
做 的 一 件 事情 ， 因 为 文件 可 能 会 因为 人 为 的 错误 或 软件 的 问题 而 被 删除 或 损坏 。 

我 们 可 以 采取 许多 种 方法 来 备份 系统 ， 但 是 其 中 有 一 种 方法 最 为 可 取 。 之 所 以 这 样 断 
定 ， 还 牵涉 如 下 的 事实 ， 即 大 多 数 的 操作 系统 在 文件 目录 中 都 拥有 一 个 标记 ， 用 来 指示 自从 
上 次 备份 以 来 对 应 文件 是 否 发 生 过 修改 变化 ， 常 常 把 这 个 标记 称 为 归档 位 (archive bit)。 至 
于 最 佳 的 处 理 程序 的 具体 细节 ， 往 往 不 尽 相 同 ， 但 为 了 解释 说 明 ， 我 们 将 假设 我 们 想 让 系统 
备份 能 够 非常 容易 地 使 用 ， 所 以 每 个 周末 我 们 都 可 以 为 整个 系统 建立 一 个 备份 。 在 备份 时 ， 
将 会 清除 所 有 文件 的 归档 位 ， 以 说 明 我 们 已 经 拥有 了 相应 文件 的 一 个 副本 。 鉴 于 系统 每 天 
都 在 运行 ， 故 而 系统 可 以 针对 每 个 发 生 更 改 的 文件 设置 其 对 应 的 归档 位 。 于 是 ， 在 每 天 结束 
时 ， 我 们 可 以 运行 另 一 个 不 同 的 备份 程序 ， 即 其 仅仅 会 复制 当天 发 生 过 改变 的 文件 ， 并 且 我 
们 将 会 把 日 期 标记 到 对 应 副本 上 s 再 次 强调 ， 我 们 每 一 天 都 这 样 做 。 于 是 ， 当 有 用 户 请 求 恢 
复 已 被 删除 的 某 个 文件 时 ， 我 们 可 以 按照 时 间 逆 序 的 方式 来 搜索 每 日 备份 得 到 的 所 有 的 文件 
副本 ， 直 到 我 们 找到 相应 的 文件 为 止 。 在 大 型 的 集中 式 运营 部 门 ， 其 备份 机 制 通常 会 具体 记 
录 哪 些 文件 是 在 哪 天 的 备份 中 ， 为 此 ， 其 至 都 没有 必要 在 所 有 各 天 备份 的 范围 内 去 查找 所 需 
的 文件 。 另外， 这 类 系统 同时 还 存在 以 下 几 项 关键 特征 。 首 先 ， 备 份 应 当 与 对 应 计算 机 不 在 
同一 个 房间 内 。 因 为 ， 万 一 发 生火 灾 ， 相 同房 间 里 的 备份 将 很 可 能 也 被 毁 掉 。 更 为 重要 的 是 ， 
基于 同样 的 原因 ， 本 周 以 前 的 所 有 备份 介质 甚至 应 当 不 要 保存 在 同一 栋 建 筑 物 中 。 因 为 ， 如 
果 发 生 了 洪水 ， 将 会 使 整个 建筑 物 在 一 段 时 间 内 都 无 法 进入 。 而 如 果 有 异地 的 备份 可 以 使 用 ， 
那么 数据 可 以 在 另外 的 一 家 机 构 的 系统 中 实施 恢复 ， 并 且 相关 恢复 操作 将 会 更 为 迅捷 - 

在 数据 象征 着 大 量 金钱 的 情况 下 ， 则 可 以 考虑 选用 另外 一 种 机 制 。 具 体 而 言 ， 相 关 数 据 
往往 可 能 包含 了 工程 或 艺术 方面 的 设计 ， 也 就 是 说 ， 数 据 当中 融入 了 创造 性 的 成 果 ， 所 以 它 
们 的 价值 是 难以 估量 的 。 换 名 话说， 这 些 数据 可 能 是 的 的 确 确 无 法 替代 的 。 在 这 种 情况 下 ， 
我 们 可 以 采用 动态 备份 系统 ， 也 就 是 说 ， 每 当 有 文件 发 生 改 变 ， 就 须 把 对 应 文件 写 人 远程 的 
备份 机 器 里 。 显 然 ， 这 种 解决 方法 比较 昂贵 ， 而 且 通 常会 牵涉 行政 管理 。 然 而 ， 对 于 这 样 的 
场合 来 说 ,相关 举措 则 是 非常 值得 的 ， 即 便 心 境 平静 下 来 明明 知道 有 关 文 件 是 安全 的 。 总 而 
言 之 ， 把 存储 介质 进行 异地 存放 无 论 如 何 是 十 分 重要 的 。 

如 果 文 件 是 在 笔记 本 电脑 上 或 者 用 于 备份 的 介质 实体 经 常 被 带 到 单位 外 面 ， 那 么 对 文件 
或 介质 采用 加 密 处 理 就 是 一 个 合理 的 意见 。 这 样 ， 即 使 计算 机 或 备份 被 盗 ， 相 关 数据 也 不 会 
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泄露 出 去 。 

对 于 经 常 性 的 备份 ， 可 以 选择 使 用 廉价 磁盘 元 余 阵列 ( RAID) 的 磁盘 组 织 方式 ， 我 们 
曾经 在 第 14 章 就 此 进行 过 讨论 。 一 些 廉价 磁盘 元 余 阵列 构 型 建立 在 相当 低下 的 成 本 基础 之 
上 ， 却 可 以 提供 实 实在 在 的 高 可 靠 性 ， 并 生还 可 以 减少 由 于 驱动 器 故障 而 导致 的 数据 丢失 的 
问题 。 不 过 ， 它 们 无 法 解决 由 于 人 为 或 软件 错误 而 导致 的 文件 丢失 间 题 。 


16.3.3 ”并 发 性 保护 


我 们 已 经 说 过 ， 我们 构建 操作 系统 ， 会 在 运行 进程 之 间 建 立 许多 保护 机 制 。 我 们 还 提 
及 ,我 们 希望 在 多 个 进程 之 上 建立 高 层次 的 系统 ， 而 在 多 个 进程 之 上 建立 系统 需要 进程 间 的 
通信 和 能力。 因此 ,我 们 需要 相关 机 制 创 造 便利 条 件 以 实现 进程 间 的 通信 。 其 中 ,共享 内 存 就 
是 操作 系统 能 够 为 这 些 应 用 程序 提供 的 一 种 机 制 。 于 是 ,我 们 为 对 应 进程 提供 了 一 种 手段 ， 
规定 了 它们 想 要 协作 并 且 共 享 访问 某 部 分 内 存 。 我 们 在 第 9 章 已 经 讨论 了 共享 内 存 使 用 中 可 
能 会 出 现 的 一 些 潜在 问题 ， 并 提 到 ， 利 用 操作 系统 必须 同时 提供 的 锁定 机 制 就 可 以 解决 相应 
问题 。 然 而 ， 这 便 又 带 来 了 牵涉 死 锁 的 另外 一 个 潜在 的 问题 。 在 这 种 情况 下 ， 通 过 锁 的 设 定 
和 释放 的 操作 次 序 的 一 致 性 则 是 能 够 避免 死 锁 的 。 


16.3.4 文件 保护 


对 于 多 用 户 系统 ,操作 系统 还 必须 提供 使 文件 私有 化 的 相应 机 制 。 私 有 化 并 不 一 定 意味 
着 只 有 唯一 的 一 个 用 户 可 以 访问 某 一 给 定 的 文件 ， 系 统 还 必须 可 能 让 多 个 用 户 去 共享 同一 个 
文件 。 在 第 6 章 , 我 们 曾 讨论 过 旧版 本 的 UNIX 和 Linux 系统 中 所 用 的 关于 文件 所 有 者 、 同 
组 用 户 (组 内 成 员 由 系统 管理 员 定 义 ) 和 所 有 其 他 用 户 的 访问 权限 指定 机 制 ， 且 这 些 权限 一 
般 通 过 chmod 实用 例 程 来 进行 设置 。 在 第 18 章 中 ,我 们 将 讨论 在 Windows NT 操作 系统 家 
族 中 指定 文件 访问 权限 的 对 应 机 制 。 而 在 第 19 章 中 ,我 们 还 将 介绍 Linux 系统 中 提供 的 更 
新 的 相关 机 制 。 

有 时 ， 并 发 进程 之 间 的 通信 会 涉及 文件 级 别 的 信息 共享 。 大 多 数 的 操作 系统 往往 在 缺 省 
情况 下 会 允许 各 个 独立 进程 并 发 地 访问 文件 。 为 了 避免 在 一 个 或 多 个 进程 写 操作 一 个 文件 时 
可 能 出 现 的 问题 ， 相 关 进 程 必须 使 用 同样 的 锁定 机 制 以 及 合理 次 序 的 上 锁 、 开 锁 操 作 来 实现 
文件 使 用 的 同步 ， 就 像 我 们 在 同步 使 用 共享 内 存 时 所 做 的 那样 。 此 外 ， 关 于 文件 保护 ,我们 
还 将 在 16.4.1 节 展 开 进一步 的 讨论 。 


16.4 通信 安全 

通常 情况 下 ， 运 行 在 一 个 系统 上 的 一 个 进程 需要 与 在 另 
一 个 系统 上 运行 的 进程 进行 通信 。 而 当 我 们 将 信息 通过 通信 
链 路 从 一 台 计 算 机 发 送 到 另 一 台 计 算 机 时 ， 在 发 送信 息 的 层 
级 上 ， 可 能 会 出 现 三 种 潜在 的 问题 ， 如 图 16-5 所 示 。 安 全 
系统 中 的 通信 往往 表示 为 是 在 两 者 之 间 ， 不 妨 称 之 为 艾 丽 丝 
(Alice) 和 鲍 勃 ( Bob )。 第 一 种 问题 是 指 ， 第 三 方 可 能 读 取 
(或 截获 ) 相关 消息 。 第 二 种 问题 是 指 ， 第 三 方 可 能 发 送 (或 
插入 ) 伪造 的 消息 。 而 最 后 一 种 问题 是 指 ， 第 三 方 可 能 自 改 
由 授权 用 户 所 发 送 的 消息 。 我 们 所 关心 的 就 是 保护 系统 防御 图 16-5 通信 威胁 





所 有 这 些 问 题 ， 即 通信 安全 的 问题 。 

我 们 通常 使 用 的 一 类 机 制 是 由 精心 制作 的 关于 如 身份 认证 之 类 的 特定 功能 的 协议 所 组 
成 的 。 例 如 ， 一 种 称 为 Kerberos 的 协议 是 针对 身份 认证 而 开发 出 来 的 。 该 协议 被 广泛 使 
用 ， 几 乎 已 经 成 为 一 种 事实 上 的 标准 。 在 Windows 2000 系统 中 ， 默 认 的 身份 认证 协议 就 是 
Kerberos。 设 计 这 样 的 协议 并 使 其 足够 安全 ， 是 一 件 非 常 复杂 的 事情 ， 故 而 凭借 其 自身 的 头 
衔 甚至 就 是 一 个 专业 。 使 用 这 样 的 安全 协议 可 以 使 我 们 确定 ， 我 们 正在 与 我 们 想 要 通信 的 一 
方 进行 通信 ， 从 而 能 够 减轻 让 第 三 方 把 伪造 信息 混入 通信 流 而 不 被 发 现 的 大 部 分 的 问题 。 


16.4.1 加密 


有 人 则 开发 出 另外 的 一 类 算法 来 确保 相关 的 消息 不 会 遭受 到 上 面 所 列 出 的 那 三 种 问题 
中 任何 一 种 问题 的 影响 。 这 些 算法 被 用 来 加 密 系 统 间 所 传输 的 消息 ， 从 而 使 它们 不 能 够 轻易 
地 被 第 三 方 所 读 取 或 读 懂 。 如 果 消 息 连 读 都 不 可 能 ， 那 么 它们 也 就 不 会 被 更 改 了 。 因 此 ， 加 
密 (encryption) 手段 可 以 消除 或 者 至 少 可 以 减轻 这 三 种 问题 中 的 两 种 问题 。 加 密 是 指 采 用 一 
种 已 知 的 算法 把 消息 (通常 称 为 明文 (plaintext) ) 打 乱 ， 相 关 算 法 往往 会 使 用 一 个 被 称 为 密 
钥 (key) 的 特殊 的 数 。 整 理 和 解读 所 接收 到 的 消息 ， 将 其 展示 为 原先 消息 的 过 程 称 为 解密 
( decryption)， 如 图 16-6 所 示 。 这 些 算 法 一 般 建 立 在 这 样 的 事实 基础 之 上 ， 也 就 是 说 ， 当 第 
三 方 捕获 到 加 密 的 消息 时 ， 其 在 不 知道 密 钥 的 前 提 条 件 下 试图 去 解密 相应 消息 将 会 是 不 可 计算 
的 〈( computationally infeasible)。 从 理论 上 来 讲 ， 拦 截 程序 可 能 会 尝试 每 一 个 可 能 的 密 钥 值 ， 
称 之 为 蛮 力 攻击 ( brute force attack， 或 称 为 穷 举 式 攻 击 )。 因 此 ， 短 语 “ 不 可 计算 的 ”是 指 ， 
运行 相应 算法 尝试 所 有 可 能 密 钥 将 会 耗费 相当 长 的 时 间 ， 从 而 使 看 到 对 应 信息 时 其 已 不 再 具有 
传输 时 的 价值 。 遗 憾 的 是 ， 不 可 计算 的 含义 是 在 不 断 变化 着 的 。 我 们 都 知道 ， 大 致 每 18 个 月 
处 理 器 的 速度 就 会 翻 一 番 ， 故 而 , 5 年 前 的 不 可 计算 的 东西 放 到 现在 或 许 已 是 非常 容易 的 事情 。 

我 们 一 直 在 讨论 的 加 密 主 要 是 在 消息 传输 背景 下 , 但是， 加 密 也 可 以 用 到 文件 系统 中 。 
万 一 计算 机 被 盗 或 者 丢失 ， 这 对 于 保护 相关 敏感 信息 就 会 非常 有 用 了 。 随 着 系统 变 得 越 来 越 
轻便 ， 这 可 能 已 经 成 为 一 项 十 分 有 用 的 功能 。 无 论 是 对 于 掌上 电脑 和 手机 ， 还 是 对 于 笔记 
本 电脑 ， 都 是 如 此 。 它 们 是 把 文件 存放 在 随机 存 取 存储 器 ( RAM) 中， 而 不 是 辅助 存储 器 
(secondary storage) 中 ， 不 过 它们 通常 仍然 可 以 进行 加 密 。 

对 称 密 钥 加 密 

有 了 时候 解 密 过 程 使 用 的 是 与 加 密 过 程 相同 的 密 钥 。 在 这 种 情况 下 ， 密 钥 必 须 只 有 发 送 者 
和 接收 者 才能 够 知道 (但 是 ， 对 于 某 一 给 定 的 加 密 消息 也 可 能 有 许多 接收 者 ， 那 么 所 有 这 些 
接收 者 均 须 知道 对 应 密 钥 )。 采 用 这 种 密 钥 的 算法 被 称 为 是 对 称 ( symmetric) 密 钥 算法 ， 有 
时 也 称 为 共享 密 钥 ( shared key) 算法 或 者 隐秘 密 钥 ( secret key) 算法 。 图 16-7 展示 了 共享 
密 钥 系统 的 工作 机 理 ， 其 间 ， 由 艾 丽 丝 和 鲍 勃 所 共享 的 隐秘 密 钥 记 作 Ks。 

有 若干 种 采用 对 称 密 钥 的 不 同 算法 。 其 中 ， 数 据 加 密 标准 ( Data Encryption Standard ， 
DES) 曾 是 使 用 了 许多 年 的 标准 算法 ,但 是 该 算法 已 不 再 被 认为 是 安全 的 。 在 2001 年 ,一 
种 被 称 为 高 级 加 密 标 准 ( Advanced Encryption Standard，AES) 的 新 算法 被 提出 。 数 据 加 密 
标准 使 用 的 是 56 位 的 密 钥 ， 而 高 级 加 密 标准 根据 用 户 需 要 可 以 使 用 128 位 、192 位 或 者 256 
位 的 密 钥 。 当 高 级 加 密 标 准 发 布 时 ， 采 用 一 种 成 本 低 于 10 000 美元 的 专门 的 硬件 系统 基于 
蛮 力 攻击 方式 在 几 个 小 时 之 内 就 可 以 破译 数据 加 密 标准 算法 。 而 采用 一 台 类 似 的 但 要 快 得 多 
的 机 器 来 破译 高 级 加 密 标 准 算 法 ， 则 需要 花 上 149 万 亿 年 。 当 艾 丽 丝 和 鲍 勃 彼此 互 不 认识 
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时 ， 采 用 这 种 共享 密 钥 机 制 会 带 来 一 个 问题 ， 也 就 是 说 ， 他 们 往往 不 愿意 交换 密 钥 。 解 决 此 
类 问题 的 一 种 比较 成 熟 的 方法 是 利用 可 信和 的 第 三 方 ( Trusted Third Party，TTP) 生成 一 个 密 
钥 并 发 送 给 他 们 。 这 种 解决 方案 要 求 用 户 双方 均 须 真正 信任 这 一 可 信 的 第 三 方 ， 并 且 该 可 信 
的 第 三 方 应 当 永 远 在 线 和 一 直 可 以 接受 访问 。 现 在 ， 已 经 出 现 了 一 些 新 的 协议 ， 如 Diffie- 
Hellman ( 迪 菲 - 赫 尔 曼 密 钥 交换 协议 ) 和 RSA， 人 允许 两 个 用 户 动态 地 生成 一 对 密 钥 ， 就 像 
下 一 段 即将 讨论 的 那样 ， 并 通过 一 个 不 安全 的 网 络 来 交换 这 对 密 钥 。 


-一 传输 通道 一 传输 通道 
Br 1 消息 [ee 
eh 鲍 勃 | (明文 ) 证 
图 16-6 ”加密 图 16-7 对称 密 钥 加 密 


非 对 称 密 钥 加 密 

其 他 的 算法 则 一 般 使 用 共同 生成 的 一 对 密 钥 ， 其 中 的 一 个 密 钥 用 于 加 密 过 程 ， 而 另 
一 个 密 钥 则 用 于 解密 过 程 。 为 此 ， 这 些 算法 通常 被 称 为 非 对 称 密 钥 算法 (asymmetric key 
algorithm ) 或 者 是 公开 密 钥 算法 ( public key algorithm )。 关 于 这 些 算 法 ， 存 在 两 个 非常 有 
趣 的 实情 。 第 一 个 实情 是 ， 这 对 密 钥 中 的 一 个 密 钥 可 以 让 整个 世界 都 知道 ， 称 之 为 公 铀 
(public key)。 而 另外 的 一 个 密 钥 则 不 公开 , 故而 被 _.、 
称 为 私 钥 ( private key)。 事 实 上 ， 这 往往 就 是 实际 zm 加 密 
情况 。 相 关 工 作 机 理 如 图 16-8 所 示 ， 其 中 ， 鲍 勃 ; 9 
的 公 钥 被 标记 为 K， 而 其 私 钥 则 被 标记 为 Ki。 

具体 而 言 ， 如 果 艾 丽 丝 想 给 鲍 勃 发 送 加 密 消 鲍 时 | 
息 ， 她 可 以 使 用 鲍 勃 的 公 钥 来 加 密 对 应 的 消息 。 由 Ri | 
于 只 有 鲍 勃 才 知 道 对 应 匹配 的 私 钥 ， 所 以 只 有 鲍 勃 图 16-8 非 对 称 密 钥 加 密 
能 够 读 取 相 应 的 消息 。 非 常 有 趣 的 是 ， 每 对 密 钥 中 无 论 用 哪 一 个 密 钥 来 进行 加 密 都 无 所 谓 ， 
只 要 另 一 个 密 钥 被 用 来 解密 就 可 以 了 。 于 是 ， 鲍 勃 可 以 使 用 他 的 私 钥 来 加 密 消 息 ， 然 后 发 送 
给 艾 丽 丝 。 如 果 艾 丽 丝 确信 她 所 拥有 的 鲍 勃 的 公 钥 确实 是 属于 鲍 勃 的 ， 那 么 她 就 会 知道 对 应 
消息 的 确 是 由 鲍 勃 所 发 来 的 。( 这 里 假设 该 消息 可 以 另外 通过 对 应 协议 来 加 以 验证 )。 关 于 使 
用 公 钥 加 密 的 另外 一 个 有 趣 的 实情 是 ， 不 同 的 密 钥 对 可 以 按 任何 次 序 进行 使 用 。 因 此 ， 艾 丽 
丝 可 以 先 使 用 鲍 勃 的 公 钥 加 密 消息 ， 然 后 再 使 用 她 自己 的 私 钥 进行 对 应 消息 的 二 次 加 密 。 而 
鲍 勃 可 以 按 相反 的 次 序 或 者 相同 的 次 序 使 用 相应 密 钥 来 进行 消息 的 解密 处 理 。 这 种 特性 往往 
用 在 一 些 电子 商务 系统 中 。 就 像 隐 秘密 钥 加 密 一 样 ， 公 开 密 钥 加 密 也 有 若干 种 算法 。 多 年 
来 ， 其 标准 算法 一 直 是 RSA 算法 (或 称 为 Rivest，Shamir，Adleman 算法 )， 是 以 此 算法 的 
开发 人 员 的 名 字 而 命名 的 。 该 算法 建立 在 素数 ( prime number， 也 称 为 质数 ) 的 基础 之 上 ， 
并 依赖 于 如 下 的 事实 ， 即 存在 高 效 的 算法 用 来 验证 某 个 数 是 否 为 素数 ， 但 却 尚未 知道 有 高 效 
的 算法 可 以 找到 某 个 数 的 素 因子 。 


16.4.2 ”消息 摘要 
在 某 些 情况 下 ,我们 不 一 定 要 隐藏 消息 的 内 容 。 我 们 只 是 希望 确保 其 没有 被 修改 过 。 在 
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这 种 情况 下 ， 我 们 可 以 计算 一 个 简单 的 、 更 为 快捷 的 函数 ， 称 之 为 消息 摘要 ( message 
digest) 或 者 散 列 ( hash) 函数 。 在 图 16-9 中 我 们 简单 地 说 明了 这 种 函数 及 其 使 用 过 程 。 此 
类 函数 把 一 条 长 消息 分 割 形 成 一 系列 较 短 的 片断 (一 般 约 为 S12 位 )， 然 后 将 它们 与 一 个 不 
能 轻易 逆转 的 所 谓 单 向 函数 相 结合 ， 所 得 结果 是 一 个 固定 长 度 的 消息 摘要 一 一 通常 大 约 为 
128 位 。 目 前 关于 消息 摘要 流行 的 主要 是 两 种 算法 ， 其 一 为 产生 一 个 128 位 散 列 码 的 MD5 
算法 ， 另 一 种 则 是 输出 一 个 160 位 散 列 码 的 安全 散 列 标准 ( Secure Hash Standard，SHA) 算 
法 。MD5 通常 用 来 验证 经 由 HTTP 或 FTP 从 互联 网 上 下 载 得 到 的 文件 ， 特 别 是 程序 。 文 件 
下 载 时 往往 会 伴随 有 文件 的 消息 摘要 ， 一 般 带 有 扩展 名 .md5。 针 对 下 载 得 到 的 文件 运行 公 
开 可 用 的 实用 例 程 ， 便 可 以 计算 出 一 个 新 的 摘要 。 如 果 新 的 摘要 与 下 载 得 到 的 摘要 相 匹 配 ， 
那么 就 可 以 确信 对 应 文件 在 上 传 到 服务 器 之 后 没有 发 生 过 改变 ， 同时 下 载 过 程 中 亦 没有 对 该 
文件 进行 过 更 改 。 遗 憾 的 是 ， 现 在 已 经 发 现 ， 仅 仅 利用 适度 的 计算 能 力 就 可 以 对 MD5 算法 
进行 破译 ， 因 此 ， 今 天 该 算法 只 能 主要 在 确保 文件 是 否 正确 下 载 方面 发 挥 作用 了 。 


艾 丽 丝 鲍 勃 





图 16-9 消息 签名 


16.4.3 ”消息 签名 与 证 书 


通过 将 消息 摘要 与 公开 密 钥 加 密 机 制 相 结合 ， 艾 丽 丝 就 能 够 有 效 地 对 消息 进行 电子 答 
名 。 设 定 艾 丽 丝 准 备 发 送 消息 M， 于 是 其 首先 会 创建 该 消息 的 摘要 。 随 后 ， 她 用 自己 的 私 
钥 对 该 摘要 进行 加 密 ， 并 把 相应 消息 和 经 过 加 密 的 摘要 同时 发 送 给 鲍 勃 。 鉴 于 鲍 勃 是 知道 艾 
丽 丝 的 公 钥 的 ， 所 以 他 可 以 解密 这 个 摘要 。 接 下 来 ， 鲍 勃 就 可 以 针对 所 接收 到 的 消息 运行 公 
开 可 用 的 摘要 算法 ， 并 对 其 计算 得 到 的 摘要 与 先前 解密 得 到 的 摘要 进行 比较 。 如 果 两 者 相 
等 ， 那 么 他 就 可 以 知道 (和 可 以 证 实 ) 艾 丽 丝 发 送 了 对 应 消息 。 这 样 便 可 以 保证 艾 丽 丝 以 后 
无 法 否认 (repudiate) 该 消息 。 请 注意 ,为 了 在 以 后 的 日 子 里 证 实 这 一 切 ， 鲍 勃 必须 保留 对 
应 消息 、 签 名 摘要 ， 还 有 艾 丽 丝 的 公 钥 ， 因 为 艾 丽 丝 有 可 能 在 后 来 会 改变 她 的 公 钥 。 同 时 还 
应 注意 ， 鲍 勃 亦 不 能 改变 对 应 消息 ， 因 为 其 仍然 需要 举证 是 艾 丽 丝 发 送 了 该 消息 ， 因 此 这 样 
也 可 以 保护 艾 丽 丝 防 止 鲍 勃 自 改 消息 。 

消息 签名 的 一 种 特殊 的 用 途 是 用 来 对 客户 机 或 者 服务 器 进行 身份 验证 ， 相 关 过 程 会 产生 
一 个 用 于 验证 身份 的 证 书 ( certificate )。 首 先 ， 运 行 一 个 特殊 的 程序 以 生成 一 份 初始 的 证 书 。 
对 于 银行 来 说 ， 其 会 在 它们 的 服务 器 上 完成 此 类 事情 。 然 后 ， 这 个 初始 的 证 书 会 发 送 到 一 家 
认证 机 构 (Certificate Authority,CA)， 而 该 认证 机 构 将 使 用 自己 的 私 钥 对 初始 证 书 进行 加 密 ， 
并 将 加 密 结果 作为 成 品 证 书 ( finished certificate) 返回 给 请 求实 体 。 现在， 银行 就 可 以 把 这 


份 证 书 安装 在 它们 的 服务 器 上 了 。 同 时 ， 银 行 还 可 以 把 这 份 证 书 发 送 给 其 客户 以 用 来 证 明 它 
自己 的 身份 。 因 此 ， 当 有 浏览 器 试图 建立 与 这 家 银行 的 服务 器 之 间 的 安全 连接 时 ， 该 服务 器 
将 会 把 对 应 成 品 证 书 发 送 给 相应 的 浏览 器 。 而 该 浏览 器 就 可 以 通过 使 用 上 述 认 证 机 构 的 公 钥 
来 解密 这 份 证 书 ， 从 而 验证 银行 的 身份 。 一 般 来 说 ， 广 为 接受 的 认证 机 构 的 公 钥 往往 都 已 内 
置 在 大 多 数 的 浏览 器 中 。 为 此 ， 浏 览 器 使 用 相应 认证 机 构 的 公 钥 对 银行 的 证 书 解 密 后 ， 用 户 
接 下 来 就 可 以 知道 其 浏览 器 是 真 的 连接 到 了 银行 的 服务 器 上 。 

我 们 之 前 曾 提 到 过 ， 艾 丽 丝 可 以 使 用 鲍 勃 的 公 钥 来 加 密 她 要 发 送 给 鲍 勃 的 消息 。 其 间 
的 一 个 问题 是 ， 艾 丽 丝 必 须 确 保 这 个 密 钥 真 的 是 鲍 勃 的 公 钥 。 她 能 够 完成 这 项 确认 的 方法 就 
是 ， 让 鲍 勃 去 利用 一 家 认证 机 构 基于 该 机 构 自 己 的 私 钥 来 签名 他 的 公 钥 。 这 样 ， 艾 丽 丝 就 可 
以 使 用 该 家 认证 机 构 的 公 钥 去 打开 密 铀 ， 从 而 验证 其 中 所 包含 的 确实 是 鲍 勃 的 公 钥 。 采 用 这 
种 方式 进行 电子 签名 的 消息 在 法 庭 上 从 法 律 角度 也 是 会 接受 和 采纳 的 。 


16.4.4 安全 协议 


正如 我 们 在 上 一 章 所 看 到 的 ， 网 络 支持 可 分 为 若干 个 层次 ， 且 每 一 层 都 提供 一 定 的 功 
能 。 一 个 非常 有 趣 的 问题 是 ， 究 竟 协 议 栈 的 哪 一 层 提 供 了 安全 性 支持 ? 碰巧 的 是 ， 安 全 功能 
在 几 个 不 同 的 层次 都 有 具体 说 明 。 对 于 互联 网 上 所 用 的 传输 控制 协议 及 网 际 协议 ( 即 TCP/ 
IP) 来 说 ,无 论 是 传输 层 还 是 网 络 层 ， 都 对 安全 功能 进行 了 规定 。 如 果 我 们 使 用 了 802.11 无 
线 网 络 连 接 ， 那么 在 数据 链 路 层 也 可 能 有 加 密 处 理 。 在 传输 层 上 ， 相 关 安 全 功能 被 定义 在 
一 个 所 谓 安 全 套 接 字 层 协议 (Secure Socket Layer，SSL ; 又 称 为 传输 层 安 全 协议 (Transport 
Layer Security，TLS ) ) 的 协议 中 。 该 协议 通常 被 用 在 网 站 服务 器 和 浏览 器 之 间 ， 和 称 为 安 
全 超 文本 传输 协议 ( Secure HyperText Transfer Protocol，HTTPS 或 secure HTTP) 的 应 用 层 
协议 相 结 合 ， 共 同 建立 起 相应 的 安全 通信 机 制 。 就 像 我 们 在 上 一 小 节 所 讨论 的 那样 ， 通 过 一 
份 证 书 ， 对 应 服务 器 的 身份 得 到 了 验证 ， 从 而 保证 对 应 客户 进程 是 在 与 相应 的 服务 器 进行 通 
话 。 这 两 个 实体 在 一 开始 使 用 他 们 自己 的 公 钥 和 私 钥 进行 非 对 称 加 密 。 接 下 来 ， 它 们 共同 决 
定 了 一 个 临时 的 安全 的 会 话 密 钥 ( session key)， 并 采用 这 个 密 钥 进行 对 称 加 密 和 继续 相应 的 
会 话 过 程 。 与 非 对 称 密 钥 相 比 ， 对 称 密 钥 会 更 加 有 效 ， 不过， 对 称 密 钥 的 重复 使 用 会 带 来 一 
定 的 风险 ， 因此， 对 称 密 钥 往往 是 针对 单一 的 连接 而 生成 ， 用 完 后 就 会 丢弃 掉 。 

在 网 络 层 也 会 提供 安全 支持 ， 相 应 的 协议 被 称 为 网 际 安全 协议 (IP security, IPsec)。 
网 际 安全 协议 是 由 互联 网 工程 任务 组 ( Internet Engineering Task Force，IETF) 开发 的 一 
组 协议 ， 用 来 支持 网 际 协 议 层 的 数据 包 的 安全 交换 。 其 支持 两 种 加 密 模 式 ， 即 传输 模式 和 
隧道 模式 。 传 输 模 式 只 对 消息 内 部 的 数据 进行 加 密 ， 而 忽略 了 数据 包头 部 。 而 隧道 模式 则 
会 同时 对 数据 包头 部 及 消息 进行 加 密 ， 故 而 更 为 安全 。 网 际 安全 协议 对 于 发 送 方 与 接收 方 
将 使 用 共享 的 公 钥 ， 这 些 公 钥 是 通过 一 种 所 谓 的 互联 网 安全 联盟 和 密 钥 管 理 协议 ( Internet 
Security Association and Key Management Protocol/Oakley, ISAKMP/Oakley ) 来 进行 交换 的 ， 
该 协议 允许 接收 方 获得 公 钥 ， 并 采用 数字 证 书 方式 对 发 送 方 的 身份 进行 验证 。 与 传输 层 安 全 
协议 相 比 ， 网 际 安全 协议 更 为 灵活 ， 因 为 它 可 以 与 所 有 的 互联 网 传输 层 的 协议 (包括 传输 控 
制 协议 TCP、 用 户 数据 报 协议 UDP、 网 际 控制 报 文 协议 ICMP) 一 起 使 用 。 不 过 ， 网 际 安全 
协议 也 要 更 为 复杂 些 ， 并 有 处 理 方面 的 管理 开销 ， 因 为 它 无 法 使 用 传输 层 上 的 那些 安全 增强 
功能 。 

在 应 用 层 上 也 有 安全 支持 ， 相 应 的 协议 被 称 为 恰到好处 隐私 协议 ( Pretty Good Privacy， 
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PGP)。 恰 到 好 处 隐私 协议 采用 的 是 公开 密 钥 系 统 ， 其 间 每 个 用 户 都 拥有 一 个 公 钥 / 私 钥 对 。 
为 了 创建 数字 签名 ， 恰 到 好 处 隐私 协议 会 根据 用 户 名 及 其 他 的 签名 数据 生成 散 列 码 。 随 后 ， 
该 散 列 码 将 使 用 发 送 方 的 私 钥 进 行 加 密 。 而 接收 方 则 使 用 发 送 方 的 公 钥 来 对 散 列 码 进行 解 
密 。 如 果 该 解码 结果 与 作为 消息 的 数字 签名 而 发 送 来 的 散 列 码 相 匹配 ， 那 么 接收 方 就 可 以 确 
信 对 应 消息 是 由 所 声明 的 发 送 方 发 送 的 ， 并且 没有 被 更 改过 ,无 论 是 意外 地 改变 还 是 有 意 地 
算 改 。 恰 到 好 处 隐私 协议 有 两 个 版 本 ， 其 中 一 个 版 本 采用 RSA 协议 交换 会 话 密 钥 ， 而 另 一 
个 版 本 则 采用 Diffie-Hellman 协议 。 进 一 步 说 ，RSA 版 本 使 用 MD5 算法 来 生成 散 列 码 ， 而 
Diffie-Hellman 版 本 则 使 用 SHA-1 算法 来 生成 散 列 码 。 


16.4.5 ”网 络 保护 


有 几 种 实际 上 并 不 是 在 操作 系统 内 部 的 工具 ， 可 以 用 在 网 络 中 来 提高 安全 性 。 但 是 ,我 
们 还 是 要 简单 地 介绍 一 下 这 些 机 制 ， 因 为 它们 会 影响 到 操作 系统 内 部 的 安全 功能 。 事 实 上 ， 
大 多 数 的 此 类 工具 都 是 运行 在 专用 计算 机 内 部 的 应 用 程序 。 

大 多 数 运行 局 域 网 的 家 庭 和 组 织 ， 往 往 只 会 通过 唯一 的 一 点 去 连接 到 互联 网 上 (然而 ， 
一 些 企 业 可 能 会 拥有 双重 连接 ， 如 果 他 们 可 以 为 额外 的 可 靠 性 的 成 本 提供 充足 的 合法 理 
由 )。 这 种 单 点 连接 是 就 各 式 各 样 的 问题 而 进行 通信 消息 的 检查 的 一 种 非常 理想 的 方案 。 提 
供 这 类 功能 的 设施 称 为 防火 墙 ( firewall)。 通 常情 况 下 ， 此 类 功能 被 嵌入 与 互联 网 进行 连接 
的 路 由 器 上 ， 因 为 不 管 以 何 种 方式 ， 路 由 器 一 直 在 查看 着 数据 包 。 一 个 典型 的 防火 墙 配 置 
如 图 16-10 所 示 。 一 般 而 言 ， 防 火 墙 可 以 完成 如 下 的 一 系列 功能 。 首 先 ， 它 可 以 通过 查看 
相关 连接 请 求 所 使 用 的 端口 号 (port number) 而 阻止 某 些 类 型 的 所 有 连接 。 其 次 ， 它 也 可 以 
检查 数据 包 的 内 部 ， 以 拒绝 接受 某 些 类 型 的 通信 流 一 一 比如 ，ping 命令 。 再 次 ， 有 些 防火 
墙 也 可 以 配置 成 禁止 那些 来 自 于 被 认为 是 不 安全 或 者 令 人 讨厌 的 网 际 协 议 地 址 ( 即 IP 地 址 ) 
的 信息 流 。 另 外 ， 防 火 墙 还 可 以 提供 已 知 的 与 特定 攻击 相关 联 的 数据 模式 ， 即 所 谓 的 签名 
(signature)。 同 时 ， 它 们 还 可 以 包含 一 个 通信 监视 器 (traffic monitor)， 用 来 监测 那些 与 正常 
通信 流 模式 存在 显著 差异 的 通信 流 模 式 。 这 种 监测 也 被 称 为 异常 检测 (anomaly detection ) 。 
采用 签名 和 蜡 常 检测 的 网 络 保护 系统 通常 被 称 为 入 侵 检 测 系统 〈Intrusion Detection System ， 
IDS) 和 入 侵 防 御 系 统 (Intrusion Prevention System ，IPS)。 图 中 的 防火 墙 还 显示 了 一 个 隔离 
区 (DeMilitarized Zone，DMZ)。 在 这 个 案例 中 ， 此 军事 术语 是 指 一 个 单独 的 网 络 ， 该 网 络 
既 可 以 从 外 网 进行 访问 ， 也 可 以 从 内 网 进行 访问 。 换 名 话说 ， 这 便 允 许 本 地 工作 人 员 维 护 放 
置 在 该 网 络 中 的 服务 器 的 内 容 ， 同 时 也 可 以 让 那些 服务 器 通过 互联 网 方式 进行 访问 。 






pa 连接 到 外 网 


内 部 网 络 
图 16-10 一 个 现代 的 防火 墙 
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在 网 络 连接 点 的 防火 墙 存在 一 个 问题 ， 那 就 是 并 非 所 有 网 络 中 的 机 器 都 需要 相同 类 型 的 
连接 。 举 例 来 说 ， 一 所 拥有 大 型 UNIX 服务 器 的 大 学 也 许可 能 会 希望 防火 墙 允 许 建立 Telnet 
会 话 ， 但 是 对 于 个 人 计算 机 来 讲 ， 可 能 就 不 需要 这 类 Telnet 会 话 。 因 此 ， 在 一 台 个 人 计算 机 
中 提供 防火 墙 功能 来 禁止 此 类 会 话 是 十 分 常见 的 情形 。 非 常 有 趣 的 是 ， 个 人 计算 机 上 的 防火 
墙 往往 被 设置 成 不 仅 阻 止 传人 型 连接 ， 也 会 阻止 许多 传 出 型 连接 ， 因 为 连接 到 流氓 主机 来 报 
告 被 盗 取 的 信息 是 许多 病毒 惯用 的 一 种 技术 。 本 地 防火 墙 一 般 是 一 个 应 用 程序 ， 而 不 是 操作 
系统 的 组 成 部 分 。 但是， 为 了 检查 正在 请 求 的 连接 以 及 传人 和 传 出 的 通信 流 ， 本 地 防火 墙 需 
要 能 够 在 协议 栈 ( protocol stack) 中 插入 它们 的 功能 。 这 对 于 构造 协议 栈 的 应 用 程序 来 讲 ， 
是 一 个 不 寻常 的 要 求 ， 但 是 ， 操 作 系 统 设计 人 员 已 经 认识 到 其 必要 性 ， 并 为 这 一 类 特殊 的 应 
用 程序 提供 了 相应 功能 支持 。 正 因 如 此 ， 相 关 程 序 不 仅 能 够 监测 消息 中 的 文本 模式 ， 而 且 还 
可 以 监视 其 他 的 系统 活动 以 检测 具有 病毒 特征 的 行为 ， 例 如 试图 访问 通常 情况 下 应 用 程序 不 
会 访问 的 某 些 特 定 系统 文件 。 


16.5 ”安全 管理 


为 确保 连接 到 网 络 的 系统 的 安全 性 ， 系 统管 理 员 必须 完成 一 些 相 关 的 事务 。 我 们 已 经 讨 
论 了 定期 备份 系统 、 防 火 墙 以 及 通信 流 监测 的 需求 。 除 此 之 外 ， 应 当 把 一 些 操作 记录 下 来 ， 
并 且 要 定期 对 相关 日 志 进 行 审查 。 首 先 需 要 记录 的 是 失败 的 登录 尝试 。 有 几 次 失败 的 登录 情 
形 是 很 正常 的 一 一 每 隔 一 定时 间 密 码 会 过 期 ， 用 户 偶尔 会 硕 错 按键 或 者 使 用 了 其 他 系统 的 密 
码 ， 等 等 。 但是， 失败 登录 数量 的 任何 陡然 上 升 ， 应 当 被 作为 是 有 人 尝试 侵入 系统 的 可 能 迹 
象 的 警报 的 理由 。 其 他 的 失败 情形 ， 比 如 在 某 网 站 服务 器 上 无 法 找到 所 请 求 的 网 页 ， 也 应 当 
被 记录 下 来 和 进行 分 析 。 此 类 错误 有 可 能 只 是 表明 错误 的 连接 ， 但 仔细 检查 也 可 能 会 发 现 是 
有 人 正在 尝试 攻击 服务 器 。 
与 其 他 的 系统 相 比 ， 有 些 系统 会 拥有 许 许多 多 的 更 高 的 安全 要 求 。 除 了 阻挡 病毒 和 黑 
客 之 外 ， 一 台 家 用 的 个 人 计算 机 可 能 并 不 需要 多 少 安全 特性 。 但 一 家 银行 的 系统 则 需要 更 高 
的 安全 级 别 ， 因 为 相关 系统 会 涉及 金钱 。 进 一 步 说 ， 一 家 承担 病人 护理 的 医院 的 系统 可 能 会 
需要 比 此 更 高 的 安全 性 ， 因 为 系统 相关 问题 可 能 甚至 就 会 决定 一 个 病人 的 生死 。 而 一 个 军事 
系统 则 可 能 需要 甚至 还 要 更 高 的 安全 性 ， 因 为 一 次 失败 就 可 能 会 计数 百 万 的 生命 遭受 危险 。 
鉴于 此 ， 美 国政 府 下 辖 的 一 家 机 构 ， 即 国家 计算 机 安全 中 心 (National Computer Security 
Center，NCSC)， 发 布 了 4 种 主要 安全 级 别 〈 另 带 有 一 些 次 级 变种 ) 的 定义 。 伴 随 安全 级 别 
的 逐 级 提升 ， 相 应 的 操作 系统 需要 提供 更 多 其 他 的 功能 ， 其 中 许多 是 在 系统 活动 审计 日 志方 
面 。 不 用 说 ， 对 于 家 里 的 个 人 计算 机 而 言 ， 我 们 并 不 希望 其 操作 系统 因 配 备 军事 系统 上 满足 
相应 安全 所 必需 的 所 有 功能 而 被 拖 垮 。 最 低 的 安全 级 别 是 DD 级， 其 具有 最 少 的 安全 性 。 办 
公 室 或 家 里 的 任何 用 户 可 能 使 用 的 就 是 这 一 安全 级 别 的 系统 。 作 为 安全 级 别 递 增 的 一 个 例 
子 ， 同 C1 等 级 的 安全 要 求 相 比 ，C2 等 级 还 需要 满足 如 下 的 一 些 要 求 : 
e 建立 在 每 个 用 户 基础 上 的 访问 控制 功能 支持 ， 其 必须 能 够 支持 任何 选 定 的 用 户 群 子 
集 的 访问 权限 设 定 。 

_e 存储 空间 使 用 后 ， 其 中 的 内 容 必 须 被 彻底 清除 。 操 作 系统 必须 确保 分 配给 一 个 进程 
的 磁盘 空间 和 内 存 不 会 包含 以 前 操作 相关 的 任何 数据 。 

e 操作 系统 必须 能 够 记录 与 安全 相关 的 事件 ， 包 括 身份 验证 和 对 象 访 问 。 审 计 日 志 必 
须 受到 保护 和 可 以 防止 自 改 ,同时 必须 记录 日 期 时间、 用 户 、 对 象 和 事件 。 
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现在 ， 大 多 数 的 商用 操作 系统 很 容易 就 能 够 达到 C2 级 别 。 而 运行 在 更 高 级 别 上 的 操作 
系统 一 般 是 针对 特定 目的 而 专门 设计 的 。 对 于 政府 使 用 场合 来 讲 ， 操 作 系 统 的 安全 级 别 必须 
通过 独立 的 第 三 方 审 计 机 构 来 进行 认证 。 此 外 ， 相 应 认证 只 会 适用 于 操作 系统 的 特定 版 本 和 
特定 的 硬件 配置 ， 因 此 ， 开 发 商 所 做 的 普通 的 认证 往往 不 会 在 这 些 更 高 安全 级 别 上 进行 。 


16.6 小结 


现在 ， 鉴 于 计算 机 系统 可 以 被 许多 用 户 所 访问 ， 而 且 其 也 更 加 频繁 地 连接 到 互联 网 上 ， 
所 以 ， 无 论 是 系统 、 其 中 的 文件 、 其 上 面 运行 的 进程 ， 还 是 用 户 之 间 的 通信 和 进程 之 间 的 通 
信 ， 都 应 当 受到 保护 和 防止 偶然 的 或 故意 的 伤害 ， 这 是 非常 必要 的 。 在 这 一 章 中 ， 我 们 围绕 
操作 系统 讨论 了 保护 与 安全 的 若干 方面 。 首 先 ， 我 们 概要 介绍 了 系统 安全 所 涉及 的 一 系列 问 
题 。 我 们 就 一 些 我 们 认为 是 由 于 连接 到 互联 网 上 而 引发 的 安全 问题 进行 了 分 类 ， 同 时 章 述 了 
操作 系统 需要 如 何 处 理 它们 ， 包 括 操作 系统 之 外 的 相关 机 制 。 然 后 ， 我 们 转 去 讨论 操作 系统 
为 用 户 提供 的 保护 服务 ， 主 要 是 在 文件 隐私 方面 的 保护 。 我 们 描述 了 这 些 服 务 的 一 般 设 计 。 
同时 ， 操 作 系统 还 必须 为 进程 提供 相应 的 保护 服务 ， 为 此 ， 在 运行 进程 与 操作 系统 之 间架 设 
起 了 重要 的 屏障 。 我 们 还 阐明 了 提供 给 作为 通信 双方 的 进程 的 一 些 服务 。 在 第 16.4 节 ， 我 
们 讨论 了 网 络 安全 ， 大 部 分 是 针对 互联 网 的 ， 具体 包 括 加 密 、 认 证 协议 、 消 息 摘要 以 及 操作 
系统 之 外 的 与 网 络 安全 相关 的 一 些 话题 。 此 外 ， 我 们 还 介绍 了 网 络 及 操作 系统 安全 方面 的 管 
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理 问 题 。 


在 下 一 章 ， 我 们 将 讨论 一 些 特殊 的 事项 ， 当 使 用 操作 系统 来 创建 跨越 多 个 系统 的 分 布 式 
系统 时 ， 我 们 必须 就 此 予以 充分 地 考虑 和 加 以 有 效 地 处 理 。 
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全 的 非 青 利 性 安全 专业 组 织 ) 
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运行 的 所 有 进程 的 软件 ) 
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计算 系统 联盟 ) 
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16.1 ” 哪 一 个 问题 更 为 严重 ,黑客 还 是 内 部 人 士 ? 请 论证 你 的 答案 。 


16.2 恶意 软件 区 别 于 病毒 程序 的 特征 是 什么 ? 


16.3 恶意 软件 区 别 于 特洛伊 木马 程序 的 特征 是 什么 ? 


16.4 恶意 软件 区 别 于 蠕虫 程序 的 特征 是 什么 ? 
16.5 简要 说 明 缓冲 区 溢出 。 
16.6” 沙 箱 模 型 的 目的 是 什么 ? 


16.7 身份 认证 利用 了 一 些 特殊 的 机 制 来 验证 实体 的 身份 。 我 们 在 大 多 数 时 候 所 关注 的 是 验证 用 户 的 
身份 。 下 面 哪 一 项 不 是 我 们 说 过 的 可 以 用 来 验证 用 户 身 份 的 ? 


a. 你 所 持 有 的 
b. 你 所 看 到 的 
c. 你 所 知道 的 
d. 你 所 特有 的 
e. 上 述 所 有 选项 均 可 用 来 验证 用 户 身 份 


16.8 一 旦 用 户 (或 其 他 实体 ) 的 身份 得 到 验证 ， 用 户 所 允许 的 操作 必须 被 授权 。 我 们 讨论 了 通常 用 于 
支持 授权 的 两 种 不 同 的 机 制 。 第 一 种 是 访问 控制 表 。 简 要 描述 访问 控制 表 是 什么 ? 


16.9 ”什么 是 权限 表 ? 

16.10 数据 的 备份 副本 应 该 存放 在 什么 地 方 ? 
16.11 短语 “ 蛮 力 攻击 ”是 什么 意思 ? 
16.12 
16.13 
16.14 


在 对 称 密 钥 加 密 系统 中 ,使 用 了 多 少 个 密 钥 ? 
在 非 对 称 密 钥 加 密 系统 中 ， 把 两 个 密 钥 都 保密 好 和 不 让 外 界 知道 是 非常 关键 的 。 这 是 否 正确 ? 
如 果 我 们 不 特别 关注 机 密 性 ， 但 我 们 希望 确保 发 送 的 消息 不 会 被 任何 一 方 更 改 ， 我 们 应 使 用 哪 


16.15 


16.16 
16.17 
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种 机 制 ? 


认证 机 构 用 其 自己 的 私 钥 对 用 户 的 公 钥 进行 了 签名 。 浏 览 器 是 如 何 使 用 相关 机 制 来 验证 用 户 的 


公 钥 的 ? 
就 安全 超 文本 传输 协议 (HTTPS ) 连接 而 言 ， 网 站 层面 使 用 了 什么 样 的 安全 协议 ? 
用 来 保护 网 络 免 受 外 部 攻击 的 常见 的 机 制 是 什么 ? 
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Operating Systems: A Spiral Approach 


分 布 式 操作 系统 





分 布 式 系统 正 日 益 普遍 和 流行 开 来 。 我 们 讨论 操作 系统 是 因为 其 处 于 我 们 的 应 用 程序 和 
硬件 之 间 。 当 我 们 开发 非 正式 的 应 用 程序 的 时 候 ， 我 们 并 没有 必要 太 多 地 担心 操作 系统 。 但 
是 ， 当 我 们 开发 高 性 能 应 用 程序 时 ， 我 们 就 需要 更 好 地 了 解 操作 系统 的 内 部 机 制 ， 以 便 我 们 
能 够 与 操作 系统 很 好 地 协作 ， 而 不 是 与 其 发 生 对 抗 。 于 是 ， 分 布 式 处 理应 运 而 生 。 正 如 我 们 
即将 看 到 的 那样 ， 当 我 们 要 设计 和 开发 支持 大 量 用 户 的 系统 的 时 候 ， 我 们 往往 必须 得 开发 分 
布 式 系统 一 一 拥有 多 个 部 分 而 且 分 别 运 行 在 不 同 机 器 上 的 系统 。 当 然 ， 我 们 也 可 能 是 出 于 性 
能 或 扩展 以 外 的 原因 而 去 构建 分 布 式 应 用 程序 ， 并 且 在 这 种 情况 下 ， 我 们 可 能 仍然 不 需要 了 
解 太 多 的 与 分 布 式 系 统 有 关 的 操作 系统 的 细节 。 但 是 ， 如 果 我 们 的 系统 是 高 性 能 的 或 大 容量 
的 应 用 程序 ， 我 们 或 许 能 够 从 了 解 底层 服务 的 工作 机 理 中 不 断 地 获得 益处 ， 那 样 我 们 就 可 以 
更 好 地 利用 相关 机 制 ， 并 且 不 会 做 出 某 些 事情 使 得 它们 毫 无 目的 地 去 完成 额外 的 工作 。 

在 本 章 开 始 的 引言 部 分 ， 我 们 主要 讨论 了 为 什么 开发 分 布 式 系统 的 一 系列 原因 ， 同 时 
还 介绍 了 分 布 透明 性 的 概念 及 其 重要 性 ， 最 后 引入 了 中 间 件 的 概念 ， 就 其 演变 过 程 及 成 因 进 
行 了 解释 。 接 下 来 ,我 们 阐明 了 分 布 式 系统 中 所 见 到 的 若干 不 同 的 模型 ， 其 中 既 包 括 客户 端 
服务 器 模型 ， 也 包括 一 些 更 为 复杂 的 模型 。 第 17.3 节 则 回顾 了 进程 和 线程 的 相关 话题 ， 并 
讨论 了 如 何在 客户 端 和 服务 器 中 更 好 地 使 用 线程 从 而 改善 和 提高 分 布 式 系统 性 能 的 方法 和 技 
术 。 当 分 布 式 系统 中 的 进程 之 间 通 信 时 ， 它 们 需要 引用 其 他 实体 ， 为 此 在 第 17.4 节 中 ,我 
们 讨论 了 命名 的 概念 和 命名 空间 。 在 第 17.5 节 中 ， 我 们 给 出 了 分 布 式 系统 的 一 些 不 同 的 范 
例 ， 包 括 远程 过 程 调用 、 分 布 式 对 象 和 分 布 式 文档 。 考 虑 到 分 布 式 系统 中 所 存在 的 一 些 特殊 
的 与 同步 相关 的 问题 ， 而 且 正 是 由 于 这 些 特 殊 问题 使 它们 不 同 于 单一 整体 系统 ， 所 以 我 们 在 
第 17.6 节 讨 论 了 同步 。 其 后 在 第 17.7 节 中 ， 我们 讨论 了 容错 以 及 分 布 式 系 统 所 具有 的 关于 
系统 中 一 个 部 件 发 生 故 障 而 其 他 部 分 继续 运行 的 特殊 问题 。 最 后 ， 我 们 在 第 17.8 节 对 这 一 
章 进行 了 归纳 总 结 。 


17.1 引言 


我 们 可 能 需要 开发 分 布 式 系统 的 原因 有 很 多 。 我 们 曾经 在 第 9 章 中 就 协作 式 进程 展开 了 
较为 详细 的 讨论 ， 因 此 我 们 在 这 里 只 是 再 次 简明 扼要 地 概括 如 下 : 

e 性 能 (performance)。 在 多 台 机 器 上 运行 的 系统 拥有 更 多 的 处 理 器 时 间 和 其 他 资源 可 
以 用 来 解决 相关 问题 。 一 些 进程 仅仅 为 了 一 次 处 理 运 行 ( 壁 如 ， 模 拟 天 气 系统 ) 就 需 
要 耗费 很 大 的 功率 。 

e 伸缩 性 〈scaling， 或 称 为 规模 扩展 )。 多 个 系统 意味 着 在 给 定 的 时 间 内 可 以 处 理 更 多 
的 事务 。 

e 组 件 购买 。 很 多 时 候 ， 购 买 系统 组 件 比 在 内 部 开发 要 便宜 许多 。 有 了 时， 系统 组 件 是 
以 这 样 的 方式 开发 的 ， 也 就 是 说 ， 其 基本 上 只 能 作为 一 个 独立 的 进程 加 以 使 用 ， 并 
且 可 能 实际 上 需要 一 个 单独 的 系统 来 运行 。 
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e 第 三 方 服务 (third-party service)。 有 时 候 应 用 程序 组 件 需要 访问 特殊 的 数据 库 且 它 
们 自身 并 未 被 销售 ， 因 此 有 关 组 件 只 能 作为 在 线 服务 (例如 信用 卡 验证 ) 方式 提供 。 
e 多 个 系统 的 组 件 。 通 常 ， 一 个 组 件 会 在 一 个 系统 中 开发 ， 但 后 来 也 需要 作为 其 他 相 
关系 统 中 的 一 个 组 件 。 在 这 种 情况 下 ， 最 好 在 一 台 专 用 的 机 器 上 隔离 运行 该 组 件 。 
e 可 靠 性 (reliability)。 当 系统 仅仅 拥有 某 组 件 的 单个 实例 时 ， 该 组 件 一 旦 发 生 故 障 便 
可 能 导致 整个 系统 停止 运行 。 而 让 每 个 组 件 拥有 多 个 实例 则 会 允许 大 型 系统 持续 保 
持 运行 ， 尽 管 这 可 能 会 带 来 性 能 的 下 降 。 
信息 的 物理 位 置 。 如 果 系 统 支 持 多 个 物理 设施 ， 则 可 能 希望 系统 各 部 分 与 相关 设施 
是 并 置 排列 的 。 举 例 来 说 ， 对 于 支持 多 个 仓库 的 仓库 库存 系统 而 言 ， 其 中 大 量 的 事 
务 通常 应 用 于 本 地 数据 库 ， 但 是 ， 那 些 牵涉 另 一 个 仓库 的 少 部 分 事务 则 需要 建立 相 
应 的 连接 。 
使 应 用 程序 的 执行 成 为 可 能 。 一 些 应 用 程序 需要 非常 多 的 资源 ， 如 果 没 有 高 度 
分 布 的 系统 ， 它 们 实际 上 是 无 法 执行 和 完成 的 。 外 星 文 明 探寻 ( Search for Extra- 
Terrestrial Intelligence，SETI) 项 目 接受 射电 望远镜 的 大 量 信号 ， 并 搜索 可 能 标明 智 
能 起 源 的 相关 模式 。 项 目 组 把 射电 望远镜 信号 划分 成 较 小 的 数据 集 ， 并 将 它们 分 发 
给 那些 通过 屏幕 保护 程序 对 这 些 数据 进行 处 理 的 志愿 者 们 。 如 果 不 是 这 样 ， 项 目 组 
实际 上 是 没有 办 法 处 理 这 些 数 据 的 。 

从 理念 上 来 说 ， 我 们 希望 分 布 式 系统 可 以 实现 若干 方面 的 目标 。 首 先 ， 分 布 式 系统 应 
当 把 用 户 和 资源 连接 到 一 起 。( 注 意 ， 在 这 里 ,“ 用 户 ” 可 以 是 男 一 个 进程 ,) 其 次 ， 系 统 应 
当 表 现 出 分 布 透 阴性 ( distribution transparency) 的 特征 。 理 想 情 况 下 ， 用户 应 当 不 会 辨别 
出 系统 是 分 布 式 的 。 同 时 ,用 户 有 可 能 从 若干 不 同 的 方面 注意 到 透明 性 的 不 足 ( lack of tran- 
sparency， 或 称 为 透明 性 的 缺乏 )。 具 体 包 括 如 下 几 方 面 的 透明 性 : 

。 异 构 性 (heterogeneity)。 不 同 的 系统 部 件 可 能 运行 在 不 同 的 硬件 系统 上 ， 甚 至 无 论 
硬件 系统 还 是 操作 系统 均 各 不 相同 的 系统 上 。 
访问 。 数 据 表示 和 访问 的 差异 性 〈 浮 点 数 格式 因 机 器 而 异 )。 

位 置 (location)。 资 源 所 在 的 位 置 (网 页 可 能 在 任何 地 方 )。 

迁移 (migration)。 资 源 是 否 可 以 移动 (脚本 由 服务 器 发 送 到 你 的 浏览 器 )。 
重 定位 (relocation)。 资 源 在 使 用 时 是 否 发 生 移动 (你 的 手机 )。 

复制 (replication)。 资 源 被 复制 (谷歌 数据 服务 器 )。 

e 并 发 (concurrency)。 资 源 可 以 由 许多 用 户 共 享 (网 站 )。 

e 持久 性 (persistence)。 资 源 是 保持 在 磁盘 上 还 是 在 内 存 中 。 

e 故障 (failure)。 资 源 在 使 用 时 是 否 发 生 故 障 (互联 网 绕 过 故障 链 路 选择 路 由 )。 

分 布 式 系统 的 一 个 关键 方面 是 它们 严重 依赖 于 相关 开放 标准 ( open standard) 来 实现 所 
期 望 的 透明 性 的 绝 大 部 分 。 计 算 机 科学 产业 界 中 存在 有 许多 标准 ， 有 些 标 准 是 专 有 的 ， 而 有 
些 标 准 是 开放 的 。 专 有 标准 通常 在 分 布 式 系统 中 用 处 不 大 ， 因 为 对 于 不 同 的 供应 商 来 说 ， 很 
难 去 测试 相应 组 件 的 互 操作 性 。 故 而 ， 由 单个 供应 商 为 分 布 式 系统 所 开发 的 许多 操作 系统 机 
制 往往 最 终 被 置 为 开启 状态 ， 从 而 方便 其 他 供应 商 可 以 测试 其 系统 的 互 操作 性 。 此 类 实例 包 
括 太 阳 微 系统 公司 ( Sun Microsystems ) 的 网 络 文件 系统 (Network File System，NES) 和 微 
软 公司 (Microsoft) 的 通用 语言 运行 库 (Common Language Runtime，CLR)。 

传统 上 ， 大 多 数 操作 系统 并 没有 支持 分 布 式 应 用 程序 所 需要 的 许多 服务 。 于 是 ， 这 些 服 
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务 被 开发 放置 在 了 所 谓 的 中 间 件 (middleware) 上 。 如 图 17-1 所 示 ， 从 功能 角度 而 言 ， 中 间 
件 模块 位 于 操作 系统 网 络 服务 和 应 用 程序 之 间 。 因 此 ， 操 作 系 统 和 网 络 模块 将 为 中 间 件 提供 
服务 ,但 在 其 他 方面 却 忽略 了 中 间 件 和 应 用 程序 之 间 的 所 有 区 别 。 网 络 服务 可 以 彼此 完全 独 
立 ， 并 通过 开放 网 络 标准 来 进行 通信 。 中 间 件 模块 也 通过 开放 标准 来 进行 通信 ， 但 是 根据 定 
义 ， 它 们 相互 协作 以 提供 跨越 系统 边界 的 服务 。 











系统 2 
图 17-1 中 间 件 服务 层 


17.2 ”分布 式 应 用 模型 


显然 ， 由 运行 在 不 同 机 器 上 的 进程 所 组 成 的 系统 需要 通信 ， 并 且 已 经 有 若干 模型 被 开发 
出 来 ， 以 用 于 描述 这 些 组 件 之 间 的 相互 作用 。 在 此 ,我 们 将 主要 介绍 以 下 模型 客户 端 - 服 
务 器 模型 、 三 层 模型 、 多 层 模型 、 水 平分 布 和 垂直 分 布 。 


17.2.1 客户 端 - 服务 器 模型 


客户 端 - 服务 器 (client-server， 或 称 为 客户 机 - 服务 器 ) 模型 如 图 17-2 所 示 。 该 模型 
可 以 说 是 众所周知 ， 几 乎 不 需要 做 任何 解释 。 客 户 端 系统 需要 访问 某 种 定义 明确 的 服务 ， 故 
而 与 提供 相应 服务 的 服务 器 进行 联系 。 我 们 在 设计 客户 端 - 服务 器 模型 时 可 能 需要 回答 的 
主要 问题 是 ， 对 于 应 用 程序 的 功能 而 言 ， 应 当 在 客户 端 部 署 多 少 ， 又 应 当 在 服务 器 上 部 署 多 
少 。 一 种 极端 方案 是 ， 有 关 应 用 程序 运行 在 中 央 系 统 上 ， 而 客户 端 几乎 就 只 是 终端 而 已 。 这 
种 模型 有 时 被 称 为 瘦 客 户 端 ( thin client)。 另 外 的 一 种 方案 则 是 ， 有 关 应 用 程序 主要 运行 在 
客户 端 工作 站 上 ， 而 服务 器 仅仅 提供 非常 有 限 的 服务 〈 例 如 数据 库 服务 ， 即 用 来 保存 应 用 程 
序 所 使 用 的 信息 )。 也 有 许 许多 多 介 于 这 两 种 方案 之 间 的 混合 模型 可 以 选用 。 我 们 将 在 下 一 
节 就 此 展开 更 为 详细 的 阐述 ， 相 关 原 理 与 这 里 的 模型 基本 一 致 ， 只 不 过 是 在 更 多 层级 上 进行 
运作 而 已 。 


17.2.2 三 层 模 型 


在 使 用 客户 端 - 服 务 器 模型 若干 年 之 后 ， 人 
们 和 逐渐 清晰 地 认识 到 ， 在 大 多 数 系统 中 容易 辨认 
的 功能 实际 上 主要 包括 三 个 方面 : 用 户 界面 (user 
interface)、 应 用 逻辑 ( application logic， 有 时 也 称 
为 业务 规则 ， 即 business rule) 以 及 数据 库存 储 (data- 
base storage)。 这 种 体系 结构 模型 ( 称 为 三 层 模型 ， 图 17-2 客户 端 - 服务 器 体系 结构 
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即 three-layer model) 如 图 17-3 所 示 。 之 所 以 形成 了 这 种 特别 的 划分 方案 ， 其 原因 可 能 在 
于 数据 库 系统 自身 的 演化 发 展 以 及 单独 为 每 个 应 用 程序 构建 此 类 设施 很 明显 是 不 太 合 算 的 
考量 。 





图 17-3 三 层 模型 


与 客户 端 - 服务 器 模型 一 样 ， 我 们 也 可 以 对 三 层 架构 设计 模型 实施 许多 变化 。 用 户 界 
面 可 以 做 得 非常 简单 ， 或 许 只 相当 于 UNIX 环境 中 的 X 终 端 (X-Terminal)。 对 于 其 他 的 情 
景 ， 个 人 计算 机 上 的 网 络 浏览 器 常常 可 以 为 应 用 程序 提供 一 种 呈现 图 形 化 用 户 界 面 的 简单 方 
式 。 在 这 种 情况 下 ,我 们 可 以 从 万 维 网 服务 器 发 送 一 个 页 面 ， 其 中 包含 该 应 用 程序 的 一 张 表 
单 (form) 供用 户 填 写 。 有 关 用 户 填 写 对 应 表单 ， 然 后 点 击 表单 上 的 按钮 ( button)。 这 一 点 
击 操作 将 会 导致 浏览 器 把 用 户 输入 表单 中 的 相关 数据 提交 给 服务 器 。 于 是 ， 服 务 器 检查 数 
据 ， 进 而 如 果 一 切 正常 ， 服 务 器 将 会 处 理 相 关 请 求 并 返回 对 应 的 结果 。 但 是 , 我们 可 以 通过 
把 某 些 处 理 迁移 到 客户 端 来 ， 从 而 改善 和 提高 有 关 设 计 的 性 能 。 进 一 步 说 ， 当 用 户 把 记录 某 
种 业务 事件 的 数据 输入 表单 中 时 ， 如 果 输 入 数据 包含 了 某 些 可 以 检测 出 来 的 错误 ， 那 么 越 早 
捕捉 到 这 样 的 错误 并 让 用 户 加 以 及 时 的 修正 ， 则 越 好 。 例 如 ， 如 果 我 们 期 望 某 字段 包含 日 期 
信息 ， 而 用 户 输入 了 一 些 字母 信息 ( 且 并 非 月 份 名 称 )， 那 么 有 关系 统 应 当 予 以 拒绝 。 如 果 
我 们 一 直 等 到 用 户 提 交 表 单 并 将 其 发 送 到 服务 器 ,然后 我 们 再 向 用 户 发 回 错误 消息 ， 那 么 我 
们 就 将 反馈 与 输入 隔 开 了 好 几 个 步骤 ， 从 而 使 反馈 的 效用 几 近 丧失 。 同 时 ， 这 也 中 断 和 扰乱 
了 用 户 的 思维 过 程 ， 因 为 用 户 已 经 在 思想 上 从 这 个 事务 离开 了 ， 或 者 认为 它 已 经 完成 了 。 换 
句 话 说， 如 果 当 用 户 把 焦点 从 日 期 域 移 走 的 那 一 时 刻 就 能 够 触发 应 用 程序 对 数据 格式 的 检 
查 ， 则 会 更 为 合理 、 效 果 也 会 更 好 。 总 而 言 之 ， 有 相当 多 的 设计 工作 常常 是 要 决定 在 客户 端 
可 以 做 什么 样 的 检查 ， 以 及 在 服务 器 端 应 该 完成 什么 样 的 任务 。 

还 有 一 些 其 他 的 功能 也 可 以 迁移 到 客户 端 来 。 例 如 ， 由 于 通信 成 本 可 能 很 高 或 者 网 络 连 
接 不 太 可 靠 ， 所 以 如 果 允 许 客户 端 在 离线 情境 下 完成 相当 数量 的 数据 收集 并 且 稍 后 当 服 务 器 
或 相关 连接 再 次 可 用 的 时 候 将 对 应 事务 数据 再 提交 给 有 关 服 务 器 ， 那 将 可 能 是 非常 有 益 的 。 

第 三 层 ， 即 数据 存储 ， 往 往 由 封装 的 数据 库 管理 系统 予以 提供 。 通 常情 况 下 ， 这 些 系统 
只 是 提供 了 一 种 更 高 级 别 的 文件 系统 ， 支 持 非常 可 靠 的 数据 存储 以 及 规范 化 表格 中 的 数据 检 
索 。 对 于 另外 一 些 案例 而 言 ， 数 据 库 系统 还 通过 运行 存储 在 数据 库 中 的 过 程 而 被 用 来 执行 一 
部 分 系统 逻辑 ， 通 过 验证 参照 完整 性 和 整理 报告 数据 等 来 改善 数据 有 效 性 。 


17.2.3 六 层 应 用 程序 


三 层 模型 常常 会 扩展 到 NN 层 ， 从 而 形成 多 层 模型 。 这 有 时 被 称 为 垂直 分 布 (vertical 
distribution)， 一 般 在 应 用 程序 可 以 被 方便 地 划分 成 若干 部 分 的 情况 下 就 会 采用 这 种 结构 。 一 
个 具体 的 例子 是 谷歌 搜索 引擎 的 架构 ， 如 图 17-4 所 示 ， 谷 歌 系 统 被 分 解 成 了 客户 端 (浏览 
右 )、( 万 维 网) 服务 器 、 拼 写 检 查 器 、 广 告 服 务 器 、 索 引 服 务 器 以 及 文档 服务 器 等 若干 部 分 。 
虽然 关于 该 体系 结构 ， 尚 未 找到 相关 的 详细 描述 ， 但 已 经 公布 的 内 容 足 以 说 明 这 一 点 。 
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图 17-4 谷歌 系统 体系 结构 


其 中 ， 有 一 个 前 端 进程 用 来 接收 相关 请 求 并 将 该 请 求解 析 成 为 一 个 个 孤立 的 单词 。 另 一 
服务 器 则 可 用 于 相应 的 拼写 校正 。 接 下 来 ， 前 端 服务 器 就 可 以 接收 到 这 些 单词 并 把 它们 传递 
给 其 他 服务 器 ， 而 这 些 服务 器 分 别 负责 包含 给 定单 词 的 网 页 索引 的 数据 库 。 进 一 步 说 ， 这 些 
服务 器 将 会 把 一 组 指针 传递 到 另 一 台 服 务 器 上 ， 而 后 者 则 会 合并 相关 指针 集合 ， 从 而 创建 指 
向 满足 完整 的 搜索 条 件 的 页 面 集合 的 一 组 指针 。 通 常情 况 下 ， 此 类 搜索 会 包含 查询 中 的 所 有 
单词 ， 但 是 也 有 可 能 是 其 他 形式 的 查询 。 还 有 一 个 服务 器 是 被 用 来 实现 从 数据 库 中 提取 广告 
信息 的 查询 的 ， 也 就 是 选取 与 搜索 字 词 相关 的 广告 或 者 选取 与 该 用 户 以 往 所 做 的 其 他 搜索 相 
关 的 广告 。 有 关 页 面 的 排名 次 序 决定 了 它们 与 用 户 查询 之 间 的 可 能 的 相关 性 ， 并 且 相 关 指 针 
用 于 从 其 他 服务 器 获取 被 缓存 的 页 面 ， 从 而 使 得 被 引用 页 面 的 短 的 片段 可 以 被 合并 到 即将 被 
返回 到 客户 端 浏览 器 的 网 页 中 。 因 此 ， 我 们 在 这 个 应 用 程序 中 至 少 看 到 了 5 个 不 同 的 层级 。 
虽然 它们 可 能 并 不 是 严格 意义 上 的 垂直 分 层 ， 但 它们 是 相互 作用 的 组 件 ， 而 且 这 些 组 件 是 服 
务 于 许多 客户 端的 独立 的 服务 器 。 


17.2.4 ”水 平分 布 


我 们 还 会 看 到 ， 另 一 种 范式 也 被 用 于 以 两 种 不 同方 式 构建 起 来 的 谷歌 系统 中 ， 即 水 平分 
布 (horizontal distribution) 。 我 们 曾经 提 到 ， 有 关 数 据 库 分 布 在 一 组 服务 器 上 ， 每 台 服 务 器 
只 负责 包含 指定 单词 (或 单词 集合 ) 的 页 面 。 这 种 布局 是 一 种 分 布 式 数 据 库 ， 其 中 一 部 分 信 
息 包 含 在 了 一 台 服 务 器 上 ， 而 一 部 分 信息 则 包含 在 了 另 一 台 服 务 器 上 。 此 外 ， 谷 歌 所 使 用 的 
服务 器 是 比较 廉价 的 个 人 计算 机 ， 而 不 是 高 性 能 的 计算 机 。 关 于 计算 机 的 确切 数量 并 不 为 人 
所 知 ， 且 有 关 估 计 各 不 相同 。 不 过 ， 据 一 家 研究 机 构 估 计 认 为 ， 谷 歌 系统 在 2007 年 中 期 拥 
有 100 万 台 服 务 器 ， 并 且 以 每 季度 多 于 10 万 台 的 速度 不 断 增加 。 谷 歌 认 为 服务 器 会 发 生 故 
障 ， 为 此 ， 处 理 包含 特定 字 词 的 文档 的 服务 器 实际 上 是 由 若干 台 服 务 器 所 组 成 一 一 在 给 定 的 
一 个 谷歌 网 络 节点 上 至 少 有 三 台 服 务 器 。 进 一 步 说 ， 字 词 数据 库 往 往 会 被 复制 到 至 少 三 个 地 
理 上 分 布 的 节点 中 ， 以 便 限 制 由 于 包含 节点 的 中 心 所 发 生 的 灾难 而 导致 的 故障 。 这 被 称 为 复 
制 型 数据 库 (replicated database)。 综 上 所 述 ， 谷 歌 数据 库 既 是 分 布 式 的 ， 又 是 复制 型 的 。 
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然而 ， 我 们 之 前 提 到 的 其 他 各 类 服务 器 也 存在 这 样 的 情况 ， 即 它们 也 并 非 分 别 由 唯一 的 
一 台 服 务 器 所 组 成 。 在 这 个 世界 上 ， 可 能 没有 任何 服务 器 能 够 跟 得 上 谷歌 每 小 时 所 接收 到 的 
搜索 请 求 的 数量 。 为 此 ， 整 个 网 络 被 设计 成 了 有 关 请 求 在 一 组 基本 相同 的 搜索 引擎 之 间 进 行 
分 发 的 方式 。 同 样 ， 广 告 服务 器 和 拼写 检查 服务 器 也 拥有 许多 实例 。 于 是 ， 整 个 系统 被 设计 
成 了 绕 过 任何 故障 节点 并 使 用 另 一 台 相应 服务 器 实例 的 方式 。 因 此 ， 所 有 的 各 种 各 样 的 服务 
右 功 能 都 得 到 了 复制 ， 就 像 数 据 库 服 务 器 一 样 。 


17.3 抽象 概念 : 进程 、 线 程 和 机 器 


进程 是 操作 系统 用 来 对 处 理 器 进行 虚拟 化 的 一 种 抽象 概念 ， 其 目的 在 于 使 一 道 正 在 运行 
的 程序 无 须 了 解 或 意识 到 其 并 没有 真正 地 控制 处 理 器 。 为 了 让 系统 在 一 道 应 用 程序 上 完成 更 
多 的 工作 ,我 们 可 以 让 一 个 进程 创建 其 他 的 进程 ， 新 创建 的 这 些 进 程 也 将 运行 ， 从 而 将 会 在 
处 理 器 上 获得 额外 的 处 理 器 执行 周期 。 然 而 ， 从 一 个 进程 切换 到 另 一 个 进程 ， 需 要 在 单 处 理 
器 系统 (uniprocessor system) 上 执行 上 下 文 切换 ( context switch)， 并 且 上 下 文 切换 会 导致 
系统 性 能 的 严重 下 降 。 所 有 的 高 速 缓存 或 者 必须 被 刷新 ， 对 于 用 来 高 速 缓存 页 表 项 的 快 表 尤 
其 如 此 ， 或 者 将 不 会 找到 任何 的 高 速 缓 存 项 ， 直 到 新 进程 运行 是 够 长 时 间 后 对 高 速 缓存 完成 
了 关于 新 进程 的 重新 加 载 。 因 为 不 能 命中 快 表 ， 所 以 将 会 导致 系统 速度 的 下 降 ， 这 种 情况 往 
往 一 直到 对 应 快 表 被 重新 加 载 从 而 映射 到 正在 启动 的 进程 的 完整 的 工作 集 ( working set) 时 
才 会 得 到 解决 。 

鉴于 此 ， 便 开发 和 形成 了 线程 的 概念 。 进 一 步 说 ， 线 程 源 自 于 人 们 关于 进程 控制 块 中 所 
持 有 的 状态 信息 实际 上 是 由 两 部 分 组 成 的 认识 。 其 中 一 部 分 代表 有 关 进 程 当 前 所 持 有 的 诸多 
资源 ， 另 一 部 分 则 保存 了 关于 处 理 器 当前 执行 点 〈 对 于 实际 上 没有 运行 的 任何 进程 而 言 ) 的 
真正 的 处 理 器 状态 。 后 一 部 分 的 存储 可 以 被 复制 ， 并 且 第 二 份 这样 的 状态 信息 可 以 用 来 跟踪 
处 理 器 关于 同一 进程 的 另 一 不 同 的 执行 点 。 为 此 ， 一道 程序 在 对 应 进程 若干 部 分 也 在 运行 的 
情况 下 ， 便 可 能 实际 上 要 求 操作 系统 允许 该 进程 的 其 他 部 分 继续 运行 ， 只 要 这 些 部 分 可 以 正 
常 通信 和 同步 相应 操作 就 行 。 于 是 ， 这 便 允 许 一 道 程序 拥有 多 个 并 行 的 执行 点 ， 并 且 不 会 引 
发 上 下 文 切 换 的 开销 。 


17.3.1 线程 


线程 可 以 采用 若干 有 益 的 方式 而 被 运用 在 分 布 式 系统 中 。 在 客户 端 系统 中 ， 线 程 可 被 用 
来 支持 处 理 操 作 与 异步 通信 的 相互 重合。 一 个 主要 的 例子 是 运行 1.0 版 超 文本 传输 协议 的 网 
络 浏 览 嚣 。 在 超 文 本 传输 协议 的 早期 版 本 中 ,浏览 器 首先 会 获取 到 文档 的 基 页 (base page)。 
伴随 浏览 器 对 文档 中 的 髋 入 式 元 素 的 扫描 ， 其 接 下 来 不 得 不 单独 连接 到 有 关 服 务 器 ,逐个 地 
去 提取 每 项 其 他 的 元 素 。 故 而 ,使 用 对 应 协议 的 浏览 器 可 以 启动 单独 的 线程 来 检索 每 项 元 
素 ， 而 不 是 逐个 直接 地 去 获取 它们 。 这 便 极 大 地 提高 了 有 关 进 程 的 速度 。 类 似 地 ， 正 在 执行 
一 长 串 远 程 过 程 调用 ( Remote Procedure Call，RPC) 的 客户 端 可 以 把 每 个 调用 放 在 一 个 独 
立 的 线程 中 进行 ， 其 前 提 条 件 是 在 一 个 调用 中 不 需要 另 一 个 调用 的 结果 。 

服务 器 端 也 可 以 充分 地 利用 线程 。 其 中 ， 主 要 的 用 途 是 在 单独 的 线程 中 处 理 每 项 传人 的 
请 求 。 一 开始 ， 系 统 启动 一 个 主线 程 ( primary thread) 或 调度 线程 ( dispatcher thread)， 用 
来 侦 听 所 传人 的 请 求 。 当 一 项 请 求 到 来 时 ， 主 线程 将 会 启动 一 个 工作 线程 ( worker thread ) 
来 处 理 相应 的 请 求 。 这 种 设计 同时 还 具有 程序 简单 性 的 优点 。 假 设 我 们 采用 了 内 核 级 线程 
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(kernel-level thread)， 如 果 有 关 工 作 线 程 执 行 了 一 个 阻塞 内 核 的 调用 ， 或 许 是 要 读 取 磁 盘 吧 ， 
那么 仅仅 是 对 应 的 线程 发 生 阻塞 ， 而 服务 器 的 其 余部 分 可 以 继续 工作 。 每 个 线程 都 通过 一 系 
列 (通常 ) 简单 的 步 又 来 处 理 相关 请 求 、 返 回 对 应 结果 并 且 终 止 。 如 图 17-5 所 示 。 


(万 维 网 ) 


服务 器 
调度 线程 





图 17-5 多 线程 服务 器 


17.3.2 ”虚拟 机 


虚拟 机 是 另 一 层级 的 抽象 一 一 虚拟 化 整 台 机 器 ， 而 非 仅仅 虚拟 化 处 理 器 。 进 一 步 说 ， 有 
两 种 不 同类 型 的 虚拟 机 ( Virtual Machine，VM)。 对 于 首 字母 缩 略 词 VM 而 言 ， 这 可 以 说 是 
一 个 令 人 可 叹 的 重 载 ， 因 为 该 缩 略 词 也 用 于 指 代 虚拟 存储 器 (Virtual Memory， 或 称 为 虚拟 
内 存 )。 当 然 ， 这 两 者 之 间 的 不 同 通常 从 上 下 文 情景 还 是 很 容易 区 别 开 来 的 。 

物理 虚拟 机 

首先 ， 我 们 来 介绍 一 下 物理 虚拟 机 的 概念 。 一 开始 ， 一 个 小 的 操作 系统 内 核 被 加 载 ， 然 
后 将 会 在 该 操作 系统 内 核 基 础 之 上 执行 其 他 的 操作 系统 。 最 初 被 加 载 的 操作 系统 称 为 主机 操 
作 系 统 (host OS)， 而 后 来 执行 的 其 他 操作 系统 则 被 称 为 客户 机 操作 系统 ( guest OS)。 这 里 
的 基本 技巧 是 ， 当 主机 操作 系统 加 载 客户 机 操作 系统 时 ， 将 会 使 后 者 运行 在 用 户 模式 。 于 
是 , 每 当 客户 机 操作 系统 试图 要 执行 任何 通常 要 求 管 态 模式 的 操作 时 ， 硬 件 将 会 触发 一 个 中 
断 并 被 主机 操作 系统 所 接收 ， 然 后 主机 操作 系统 将 会 执行 相应 操作 ， 并 且 当 完成 有 关 操 作 

时 ， 将 会 把 对 应 结果 返回 给 客户 机 操作 系统 。 如 图 17-6 所 示 。 关 于 在 同一 时 间 在 同一 台 机 
器 上 运行 多 个 操作 系统 能 够 派 上 用 场 的 理由 有 好 多 。 就 分 布 式 处 理 而 言 ， 其 主要 原因 是 把 多 
台 服 务 器 合并 到 一 个 系统 上 。 构 建 一 台 非 常 可 靠 的 高 性 能 的 服务 器 ， 并 将 其 放置 在 一 个 安全 
的 位 置 是 相当 昂贵 的 。 通 常情 况 下 ， 现 在 购买 的 一 台 服 务 器 往往 会 比 运行 相 应 服务 实际 所 需 
的 功能 要 强大 得 多 。 采 用 虚拟 机 将 可 以 支持 多 人 台 服 务 器 的 整合 。 这 便 可 以 节省 硬件 上 所 花 的 
开销 ， 因 为 一 台 较 大 的 服务 器 可 以 替代 若干 台 较 小 的 服务 器 ， 并 且 消 耗 的 功率 和 冷气 都 将 大 
大 减少 。 如 果 各 服务 器 运行 在 不 同 的 操作 系统 平台 上 ， 将 会 特别 有 用 。 不 过 ， 即 使 各 服务 器 
运行 在 同一 种 操作 系统 上 ， 虚 拟 机 也 可 以 运行 任何 客户 机 操作 系统 的 多 个 副本 。 这 看 起 来 有 
点 怪 怪 的 ， 但 是 这 确实 有 助 于 服务 器 功能 的 隔离 ， 因 为 这 样 ， 
一 个 客户 系统 的 崩溃 将 不 会 影响 到 任何 其 他 的 客户 系统 。 

抽象 虚拟 机 

抽象 虚拟 机 是 另 一 种 类 型 的 虚拟 机 ， 其 被 设计 为 运行 某 | | 人 | 和 
种 中 间 语 言 (intermediate language) 的 机 器 的 软件 模拟 。 对 " 3 号 
应 主要 的 例子 是 由 太阳 微 系统 公司 (Sun Microsystems) 开 
发 的 Java 虚拟 机 (Java Virtual Machine, JVM) 以 及 由 微软 图 17-6 物理 虚拟 机 
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公司 (Microsoft) 开发 的 作为 .NET 系统 的 组 成 部 分 的 通用 语言 运行 库 (Common Language 
Runtime，CLR)。 它 们 在 分 布 式 处 理 中 得 到 了 广泛 的 运用 ， 且 主要 是 出 于 三 方面 的 原因 : 代 
码 移动 性 (code mopbility)、 代 码 可 移植 性 ( code portability) 和 安全 性 。 就 代码 的 移动 性 而 
言 ， 其 允许 将 编译 后 的 程序 从 服务 器 下 载 到 客户 端 从 而 在 本 地 运行 。 当 从 一 台 服 务 器 下 载 
Java 小 程序 (Java applet) 并 在 客户 端 浏 览 器 中 运行 时 ， 便 属于 这 种 情况 。 在 客户 端 浏览 器 
中 包含 有 Java 虚拟 机 的 实现 ， 因 此 Java 程序 可 以 从 服务 器 复制 过 来 并 在 客户 端 运行 ， 这 可 
能 是 由 于 我 们 前 面 所 提 到 的 某 种 原因 。 对 于 运行 在 虚拟 机 中 的 代码 ， 其 可 移植 性 更 强 ， 因 为 
虚拟 机 本 身 就 可 以 被 移植 到 任何 硬件 和 平台 上 。 因 为 目标 机 器 是 虚拟 的 ， 所 以 向 软件 供应 商 
保证 了 广阔 的 市 场 。 不 过 ， 鉴 于 Java 虚拟 机 可 能 正在 客户 端的 浏览 器 中 运行 ， 所 以 我 们 可 
能 会 有 一 些 风险 ， 即 下 载 的 小 程序 可 能 会 出 现 安全 问题 。 因 此， 默认 情况 下 ， 浏览 器 往往 会 
严格 限制 有 关 小 程序 可 以 实施 的 行为 一 一 壁 如 禁止 访问 本 地 硬盘 驱动 器 。 一 般 来 说 ， 客 户 端 
浏览 器 可 以 被 配置 为 指示 某 些 特定 的 站 点 是 可 信和 的 一 一 辟 如 客户 端 公司 总 部 ， 并 且 来 自 相应 
站 点 的 代码 将 被 允许 完成 某 些 事情 ， 而 这 些 事情 是 不 允许 源 自 其 他 站 点 的 代码 来 执行 的 。 相 
对 于 在 浏览 器 的 虚拟 机 仿真 平台 上 的 执行 而 言 ， 另 一 种 替代 方案 是 ， 有 关 程 序 可 通过 一 种 称 
为 即时 (Just-In-Time，JIT) 编译 的 操作 而 被 编译 成 目标 机 器 的 本 机 机 器 代码 ( native machine 


code)。 


17.4 命名 


分 布 式 应 用 程序 需要 在 所 牵涉 的 各 种 各 样 的 进程 之 间 进 行 通信 。 当 进程 通信 时 ， 它 们 需 
要 引用 其 他 的 实体 ， 壁 如 文件 、 套 接 字 、 记 录 、 用 户 ， 等 等 。 对 实体 的 引用 可 以 采取 多 种 形 
式 。 我 们 需要 区 分 清楚 名 称 、 标 识 符 和 地 址 。 名 称 代表 实体 。 用 户 有 名 称 。 计 算 机 系统 也 有 
名 称 一 一 例如 ，webserv.example.com。 名 称 可 以 被 重用 ， 故 而 对 于 刚才 所 举 的 域 的 例子 来 
说 ， 有 可 能 会 将 当前 称 为 webserv 的 一 个 系统 替换 为 另 一 个 系统 ， 从 而 调用 了 新 的 webserv 
系统 。 这 对 于 任何 类 型 的 服务 器 尤其 可 能 如 此 。 我 们 可 能 期 望 访问 的 许多 其 他 的 实体 也 拥有 
名 称 。 名 称 不 一 定 是 唯一 的 。 因 此 ， 我 们 创建 了 真正 的 标识 符 (true identifier)。 一 般 来 说 ， 
标识 符 是 由 权威 机 构 发 布 的 。 标 识 符 从 不 重复 使 用 ， 也 永远 不 会 被 复制 ， 故 而 始终 指向 同一 
个 实体 。 具 体例 子 包 括 用 户 的 社会 保险 号 码 或 网 卡 中 烧 录 的 介质 访问 控制 地 址 。 最 后 ， 地 址 
代表 实体 的 接 人 和 人 位置。 具体 例子 包括 电话 号 码 、 网 际 协议 地 址 和 套 接 字 (或 端口 )， 末 者 常 
常用 来 寻 址 计算 机 系统 内 的 一 个 特定 的 进程 或 线程 。 

引用 在 单一 系统 中 的 传递 往往 非常 简单 ， 因 为 整个 系统 共用 一 套 通用 的 引用 框架 。 因 
此 ， 对 于 大 多 数 的 平台 而 言 ， 一 个 没有 任何 其 他 上 下 文 的 简单 的 文件 名 ， 首 先 将 会 被 假定 在 
当前 工作 目录 ( current working directory) 中 。 如 果 在 当前 工作 目录 中 没有 找到 ， 那么 将 会 
使 用 一 系列 备 选 的 目录 。 它 们 通常 在 为 系统 (或 为 给 定 用 户 ) 所 定义 的 某 组 全 局 的 取 值 中 加 
以 指定 。 在 微软 的 操作 系统 上 ， 这 组 取 值 被 称 为 环境 变量 (environment variable)， 且 其 中 之 
一 被 称 为 路 径 (path) 。 对 应 路 径 是 操作 系统 用 来 查找 不 带路 径 名 的 一 个 文件 时 将 会 搜索 的 一 
系列 目录 。 这 些 备 选 目录 共同 组 成 了 一 个 通用 的 引用 框架 ， 且 其 中 的 文件 名 具有 意义 。 系 统 
上 的 所 有 进程 往往 会 共享 这 一 引用 框架 。 

由 于 这 一 通用 的 引用 框架 ， 所 以 实体 引用 在 单一 系统 中 的 传递 往往 并 不 困难 。 然 而 ， 分 
布 式 系统 则 要 复杂 许多 。 这 是 由 分 布 式 系统 的 异 构 特性 所 造成 的 问题 之 一 一 一 它们 一 般 不 
会 分 享 通用 的 引用 框架 。 为 了 提供 通用 的 引用 框架 ， 业 界 已 经 建立 了 一 些 全 局 性 的 引用 框 
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架 ， 常 常 称 为 名 称 空间 (name space)。 名 称 空间 是 有 组 织 的 信息 集合 ， 其 中 ， 名 称 可 以 被 定 
位 。 主 要 的 例子 是 域名 系统 ( Domain Name System，DNS ) 。 域 名 系统 是 由 互联 网 命名 机 构 

(Internet Naming Authority，INA) 所 定义 的 分 层 式 名 称 空间 。 对 于 进程 来 说 ， 通 过 传递 域名 
系统 名 称 进 行 查找 并 发 现 与 相应 名 称 所 对 应 的 网 际 协 议 地 址 是 非常 简单 的 。 通 常情 况 下 ， 对 
应 进程 往往 会 拥有 一 个 与 网 际 协议 地 址 一 起 使 用 的 套 接 字号 (socket number)， 并 且 这 一 连 
接 到 一 起 的 数字 确定 了 所 寻 址 的 系统 中 的 特定 的 软件 实体 。 


17.4.1 ”发现 服务 和 Jini 


发 现 服务 ( discovery service) 是 分 布 式 系统 的 一 项 重要 功能 ， 而 Jini (发 音 类 似 于 
genie， 即 精灵 ) 则 是 一 种 用 于 动态 创建 分 布 式 系统 并 完成 发 现 服务 的 中 间 件 设计 。 它 是 支持 
。 开发 人 员 创 建 高 度 适 应 变化 的 无 论 硬件 还 是 软件 的 网 络 服务 的 一 种 开放 式 规范 。 这 种 设计 具 
体 规定 了 客户 端 在 网 络 上 查找 服务 ， 然 后 使 用 相关 服务 完成 任务 的 方法 。 进 一 步 说 ， 服 务 提 
供 者 向 客户 端 发 送 相关 Java 对 象 ， 从 而 为 客户 端 提供 对 相应 服务 的 访问 。 这 种 交互 可 以 使 
用 任何 中 间 件 技术 ， 因 为 客户 端 只 会 看 到 对 象 ， 并 且 所 有 的 网 络 通 信 仅 限于 该 对 象 以 及 其 所 
访问 的 服务 。 
当 一 项 服务 加 入 启用 Jini 的 网 络 时 ， 该 服务 便 通 过 发 布 实现 已 知 服务 的 应 用 程序 接口 的 
对 象 的 方式 来 公布 自己 。 而 客户 端 则 通过 查找 支持 其 想 要 使 用 的 应 用 程序 接口 的 对 象 来 查找 
有 关 服 务 。 于 是 ， 当 客户 端 发 现 对 应 服务 的 已 发 布 对 象 时 ， 便 可 以 下 载 用 来 与 对 应 服务 进行 
通信 的 相关 代码 。 


17.4.2 ”发 现 服 务 、X.500 以 及 轻 量 级 目录 访问 协议 


目录 访问 协议 (Directory Access Protocol, DAP) 是 由 国际 电信 联盟 电信 标准 局 (International 
Telecommunication Union-Telecommunication Sector，ITU-T) 和 国际 标准 化 组 织 ( Interna- 
tional Organization for Standardization，ISO) 所 规定 的 用 于 与 X.500 目录 服务 一 起 使 用 的 网 
络 标准 。 其 目的 是 被 客户 端 计算 机 所 使 用 ， 但 是 并 不 太 成 功 ， 因 为 几乎 没有 用 于 个 人 计算 机 
的 开放 系统 互 连 ( Open System Interconnect，OSI) 协议 簇 的 实现 。 目 录 访 问 协 议 的 基本 操 
作 被 包含 在 了 Novell 目录 服务 ( Novell Directory Service，NDS) 中 ， 后 来 还 被 包含 在 了 轻 
量 级 目录 访问 协议 (Lightweight Directory Access Protocol，LDAP) 中 。 

轻 量 级 目录 访问 协议 旨 在 成 为 访问 X.500 目录 服务 的 轻 量 级 替代 方案 ， 并 且 能 够 运行 在 
传输 控制 协议 / 网际 协议 的 上 面 。 进 一 步 说 ， 其 目的 在 于 客户 端 可 以 通过 从 轻 量 级 目录 访问 
协议 到 目录 访问 协议 的 网 关 ( LDAP-to-DAP gateway) 来 访问 X.500 服务 。 然 而 ， 基 于 轻 量 
级 目录 访问 协议 的 目录 服务 器 迅速 兴起 。 轻 量 级 目录 访问 协议 受到 了 企业 界 的 普遍 欢迎 。 它 
成 为 Windows XP 的 默认 目录 服务 ， 并 且 也 可 方便 用 于 现今 大 多 数 其 他 的 操作 系统 。 轻 量 级 
目录 访问 协议 包含 有 非常 强大 的 认证 协议 ， 故 而 对 于 分 布 式 服务 的 访问 是 十 分 安全 的 。 


17.4.3 ”对 移动 式 网 际 协 议 的 实体 的 定位 

如 果 设 备 是 移动 的 ， 那 么 它们 在 互联 网 上 使 用 网 际 协议 进行 通信 时 便 会 产生 一 个 特殊 的 
问题 。 这 一 问题 的 出 现 是 因为 节点 的 网 际 协议 地 址 的 一 部 分 指定 了 对 应 节点 所 连接 的 网 络 。 
如 果 该 节点 移动 到 另 一 不 同 的 网 络 ， 那 么 相应 的 网 际 协议 地 址 应 该 发 生变 化 。 但 是 ， 传 输 控 
制 协议 连接 模型 和 大 多 数 其 他 的 协议 并 没有 设计 为 允许 在 会 话 期 间 改 变 网 际 协议 地 址 。 因 
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此 ， 跟 踪 移 动 式 网 际 协议 (mobile IP) 的 实体 是 十 分 困难 的 。 移 动 式 网 际 协议 在 无 线 环境 中 
可 请 是 司空 见 惯 ,例如 ， 当 用 户 从 家 里 到 学 校 去 工作 时 ， 有 关 用 户 将 会 带 着 他 们 的 移动 设备 
跨越 多 个 网 络 。 395 

针对 移动 式 网 际 协议 的 协议 簇 由 3344 号 互联 网 标准 草案 ( Request For Comment，RFC) 
给 出 了 具体 规定 。 一 般 来 说 ， 要 采用 移动 式 网 际 协议 的 节点 往往 会 拥有 自己 的 一 个 称 为 主 地 
址 (home address) 的 网 际 协议 地 址 。 该 节点 将 会 在 自己 的 主 网 络 (home network) 服务 器 上 
进行 注册 ， 对 应 服务 器 被 称 为 移动 式 网 际 协 议 主 代 理 (IP home agent)。 当 该 节点 移动 到 另 
一 个 网 络 时 ， 它 将 会 被 赋予 一 个 在 新 的 网 络 上 的 网 际 协议 地 址 。 这 被 称 为 转交 地 址 ( care-of 
address)。 然 后 ， 该 节点 将 会 搜索 一 个 称 为 移动 式 网 际 协议 外 部 代理 (IP foreign agent) 的 服 
务 器 ， 并 把 自己 的 主 代理 的 位 置 告诉 该 外 部 代理 。 于 是 ， 该 外 部 代理 便 会 连接 到 对 应 节点 的 
主 代理 上 ， 而 相应 的 主 代理 将 会 把 这 一 临时 的 新 的 网 际 协议 地 址 存储 到 一 个 数据 库 中 ,并 且 
将 在 当地 用 该 网 际 协议 地 址 来 注册 自身 。 一 台 需 要 与 该 移动 节点 进行 通信 的 主机 在 一 开始 连 
接 到 了 该 节点 的 主 地 址 上 。 故 而 ， 当 有 关 数 据 包 被 主 代理 所 接收 后 ， 将 会 由 该 主 代理 利用 新 
的 网 际 协议 报关 把 相应 的 数据 包 转 发 到 对 应 移动 节点 的 转交 地 址 ， 且 原先 的 网 际 协议 数据 
包 被 保留 在 了 新 的 数据 包 中 。 而 该 节点 中 的 移动 式 网 际 协议 软件 将 会 剥离 掉 外 层 的 数据 包 
报头 ， 并 把 内 层 的 数据 包 传 给 该 节点 中 的 应 用 软件 。 这 一 过 程 被 称 为 网 络 隧道 (tunneling ) 。 
有 关 应 用 软件 无 须 关 心 自己 正 运 行 在 移动 环境 中 (也 就 是 说 ， 相 关中 间 件 提供 了 移动 透 
明 性 )。 


17.5 其 他 分 布 式 模型 


我 们 在 前 面 讨论 了 客户 端 - 服务 器 模型 以 及 在 该 模型 基础 上 的 若干 变种 ， 而 在 分 布 式 系 
统 中 ， 还 有 其 他 的 一 些 模型 也 是 十 分 有 用 的 。 


17.5.1 远程 过 程 调 用 


现 有 的 单机 系统 (monolithic system) 常常 需要 修改 成 为 分 布 式 系 统 。 一 种 分 离 现 有 进 
程 的 模型 就 是 从 现 有 的 应 用 程序 中 移出 某 些 子 例 程 并 让 它们 运行 在 一 台 单独 的 服务 器 上 ， 称 
之 为 远程 过 程 调用 ( Remote Procedure Call，RPC)。 这 是 一 项 很 有 用 的 技术 ， 因 为 它 融 入 了 
程序 员 业 已 熟悉 的 组 件 模型 ( component model)。 从 原理 上 讲 ， 有 关 思 想 非 常 简单 一 一 从 一 
个 运行 系统 中 取出 一 个 子 例 程 并 将 之 部 署 在 一 台 服 务 器 上 。 其 间 ， 用 来 替换 被 移出 例 程 的 新 
的 例 程 被 称 为 客户 端 桩 (client stub) 例 程 。 进 一 步 说 ， 客 户 端 桩 例 程 知道 相应 真正 的 子 例 程 
位 于 其 他 某 处 地 方 ， 并 将 触发 远程 过 程 调用 的 中 间 件 来 查找 和 调用 该 子 例 程 。 相 关 处 理 模 型 
如 图 17-7 所 示 。 但 是 ， 分 布 式 系 统 可 能 存在 的 异 构 特 性 却 使 得 有 关 过 程 颇 为 复杂 。 用 来 定 
义 远程 过 程 调用 的 1831 号 互联 网 标准 草案 假设 有 关系 统 是 异 构 的 ， 这 便 意 味 着 传递 给 子 例 
程 的 参数 必须 得 转换 为 运行 对 应 子 例 程 的 服务 器 的 格式 ， 并 且 在 返回 时 必须 得 以 相反 的 方式 
来 转换 对 应 返回 值 。 这 一 过 程 被 称 为 编组 ( marshalling) 和 解 组 (unmarshalling)。 同 时 ， 在 
服务 器 系统 上 应 当 设 立 另 外 的 一 个 桩 例 程 ， 而 且 ， 从 其 调用 对 应 子 例 程 的 角度 来 讲 ， 该 服务 
器 桩 例 程 顶 蔡 了 原始 程序 的 作用 。 具 体 而 言 ， 服 务 器 桩 例 程 接收 来 自 于 客户 端 系统 的 消息 ， 
把 有 关 参 数 解 组 成 为 服务 器 平台 所 要 求 的 格式 ， 然 后 调用 对 应 子 例 程 ， 接 下 来 解 组 所 返回 的 
参数 ， 最 后 将 它们 打包 成 消息 和 发 给 客户 端 桩 例 程 。 

鉴于 客户 端 系统 并 不 清楚 服务 器 系统 是 运行 在 什么 平台 上 ， 所 以 客户 端 桩 例 程 将 把 有 关 参 数 
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转换 成 由 1832 号 互联 网 标准 草案 所 定义 的 称 为 外 部 数据 表示 (eXternal Data Representation ， 
XDR) 的 中 间 格 式 。 此 中 间 格 式 是 与 平台 无 关 的 ， 允 许 我 们 以 一 种 标准 化 的 与 平台 无 关 的 格 
式 来 表示 任何 数据 。 不 过 ， 对 于 给 定 平台 的 远程 过 程 调用 实现 则 必须 要 定义 从 外 部 数据 表示 
格式 到 本 机 平台 格式 的 相关 映射 。 : 














远程 过 程 调用 远程 过 程 调用 
的 客户 端 系统 的 服务 器 系统 


图 17-7 远程 过 程 调用 模型 


当 从 程序 中 移 除 一 个 子 例 程 的 时 候 ， 必 须 得 用 相应 的 客户 端 桩 例 程 来 加 以 替代 。 通 常 ， 
从 一 种 所 谓 的 接口 描述 语言 (interface description language, IDL) 人 手 来 创建 有 关 的 桩 例 程 。 
大 多 数 的 接口 描述 语言 与 C 语言 相 类 似 。 桩 例 程 用 于 声明 被 移出 的 例 程 的 参数 的 类 型 。 一 
旦 采用 接口 描述 语言 对 有 关 接 口 进行 了 描述 ， 那 么 接 下 来 就 应 针对 相应 描述 来 运行 一 个 特定 
于 客户 端 平 台 和 源 语言 的 接口 描述 语言 编译 器 。 这 将 会 产生 两 样 东西 ， 具 体 包 括 一 个 即将 被 
插入 原始 程序 中 用 以 描述 所 缺失 的 例 程 参数 的 头 文件 以 及 一 个 应 当 被 编译 的 单独 的 源 程序 ， 
且 后 者 将 会 成 为 客户 端 桩 例 程 。 相 关 过 程 如 图 17-8 所 示 。 该 例 程 的 目标 格式 将 与 原始 应 用 
程序 进行 链接 从 而 生成 修改 后 的 应 用 程序 。 相 应 的 接口 描述 语言 是 标准 化 的 ， 因 此 同样 的 接 
口 描述 语言 文件 可 以 被 用 来 在 服务 器 平台 上 生成 服务 器 桩 例 程 以 及 被 该 桩 例 程 所 调用 的 修改 
后 的 例 程 。 








代码 
图 17-8 ”远程 过 程 调用 的 桩 例 程 的 创建 


如 前 所 述 ， 远 程 过 程 调用 由 互联 网 标准 草案 进行 了 定义 ， 而且， 有 关 规 范 在 具体 的 软 
件 包 中 得 到 了 实现 。 进 一 步 说 ， 其 中 就 包括 由 开放 集团 ( Open Group， 也 就 是 对 象 管理 组 
(Object Management Group ，OMG ) ) 作为 开源 项 目 所 创建 的 称 为 分 布 式 计 算 环境 ( Distri- 
buted Computing Environment，DCE ) 的 一 种 颇 为 标准 化 的 实现 方案 。 毫 无 疑问 ， 各 家 系 
统制 造 商 能 够 创造 出 他 们 自己 的 软件 包 实现 方案 ， 但 是 ， 采 用 这 种 开源 代码 所 拥有 的 优势 在 
于 ， 相 关 软 件 包 是 经 过 了 严格 测试 的 。 毕 竟 ， 开 放 集 团 是 由 超过 800 家 组 织 所 构成 的 特 设 
集团 。 
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17.5.2 ”分布 式 对 象 


分 布 式 对 象 模型 是 与 远程 过 程 调 用 非常 类 似 的 一 种 模型 。 有 关 技 术 非 常 相像 ， 但 是 对 象 
要 比 子 例 程 更 为 复杂 。 同 时 ， 相 关 组 件 的 命名 也 略 有 不 同 。 在 客户 端 系统 上 的 桩 程序 被 称 为 
代理 程序 (proxy)， 而 在 服务 器 端的 桩 程序 被 称 为 程序 框架 ( skeleton)。 通 常情 况 下 ， 在 服 
务 器 端 还 会 发 现 一 个 称 为 对 象 适 配器 ( object adapter) 的 额外 的 组 件 。 其 功能 是 就 如 何 调用 
有 关 对 象 实施 一 些 管理 方面 的 限制 ， 最 常见 的 限制 如 串 行 化 器 〈serializer)， 即 限制 有 关 对 象 
每 次 只 能 调用 一 个 ， 除 非 已 经 确认 相应 对 象 是 线程 安全 的 。 

与 远程 过 程 调用 一 样 ， 分 布 式 对 象 也 由 相关 规范 进行 了 定义 ,并 且 在 特定 的 软件 包 中 予 
以 了 实现 。 通 用 对 象 请 求 代理 ( Common Object Request Broker，CORBA) 体系 结构 是 关于 
分 布 式 对 象 的 主要 标准 之 一 ， 且 该 项 标准 也 是 由 开放 集团 所 定义 的 。 在 有 关 体 系 结构 中 ， 中 
间 件 层 本 身 拥有 一 个 特定 的 名 称 ， 即 对 象 请 求 代理 (Object Request Broker，ORB ， 按 “orb” 


发 音 )。 


17.5.3 分布 式 文档 


分 布 式 文档 ( distributed document) 是 在 分 布 式 处 理 中 所 使 用 的 另外 一 种 模型 。 垢 庸 置 
疑 ， 万 维 网 ( World Wide Web，WWW) 是 关于 这 一 模型 的 最 为 知名 的 实例 。 最 初 ， 万 维 网 
只 是 作为 一 种 提供 方便 获取 与 原子 能 相关 的 研究 论文 的 机 制 而 被 创建 起 来 的 。 它 包含 了 一 种 
称 为 超 链 接 ( hyperlink) 的 引用 其 他 文献 的 技术 ， 尽 管 这 并 非 一 种 全 新 的 概念 。 在 文本 文档 
中 也 常常 可 能 嵌入 链接 来 引用 图 形 源 文件 ， 即 包含 相应 图 形 的 原文 献 。 当 然 ， 现 在 这 一 模型 
已 经 得 到 了 极 大 的 发 展 ， 并 且 比 文档 中 的 链接 要 复杂 许多 。 事 实 上， 我 们 通常 会 提 到 “网 
页 ”而 不 是 文档 。 现 今 的 想法 是 ， 一 个 网 页 最 多 只 能 包含 几 千 个 词 ， 并 且 应 当 根 据 需要 链接 
到 其 他 的 网 页 上 。 如 今 的 网 页 不 仅 可 以 包含 到 诸如 声音 和 电影 等 其 他 多 媒体 元 素 的 链接 ， 也 
可 以 包含 关于 表单 的 链接 ， 从 而 支持 用 户 输 入 信息 以 与 在 服务 器 上 运行 的 应 用 程序 来 进行 交 
互 。 更 为 重要 的 是 ， 网 页 现在 可 以 包含 譬如 脚本 和 小 程序 在 内 的 可 编程 元 素 。 为 此 ， 可 能 需 
要 采用 那些 原本 设计 是 为 了 创建 网 页 的 工具 来 开发 非常 复杂 的 应 用 程序 。 此 类 接口 的 最 大 优 
势 在 于 客户 端 仅仅 需要 一 个 浏览 器 来 访问 应 用 程序 的 相关 功能 。 从 理论 上 来 说 ， 这 便 意 味 着 
应 用 程序 网 页 不 仅 可 以 通过 个 人 计算 机 来 进行 访问 ， 而 且 还 可 以 通过 掌上 电脑 和 手机 来 加 以 
访问 。 不 过 ， 相 关 使 用 也 存在 一 些 困 难 ， 主 要 牵涉 访问 速度 及 屏幕 尺寸 问题 。 因 为 ， 现 今 大 
多 数 网 站 是 基于 较 大 的 用 户 屏幕 和 快捷 的 连接 速度 等 假设 前 提 而 设计 的 。 

采用 文档 模型 的 另外 一 种 不 太 知 名 的 系统 是 Lotus Notes。 它 是 一 种 按照 各 种 主题 把 相 
关 便 得 库 加 以 上 曝光 的 高 度 复杂 的 应 用 程序 。 某 些 主 题 会 通过 电子 邮件 等 方式 自动 推送 给 所 有 
用 户 。 而 另外 的 一 些 主题 内 容 则 只 有 在 相应 用 户 请 求 时 才 会 被 访问 。 尽 管 并 没有 非常 多 的 机 
构 是 Lotus Notes 的 用 户 , 但 有 关机 构 却 往往 是 拥有 许多 用 户 的 大 型 组 织 ， 因 此 在 采用 文档 
模型 的 分 布 式 系统 的 任何 讨论 中 ,该 系统 通常 至 少 值得 一 提 。 

采用 文档 模型 的 其 他 系统 还 包括 互联 网 电子 邮件 和 网 络 新 闻 。 它 们 各 自 以 不 同 的 方式 进 
行 运作 ， 并 利用 相应 的 推送 和 拖 搜 协议 及 特定 的 途径 向 客户 端 分 发 信息 。 


17.5.4 ”分 布 式 文件 系统 


文件 是 所 有 的 程序 设计 人 员 以 及 大 多 数 的 用 户 都 理解 的 一 个 概念 ， 于 是 自然 而 然 地 ， 许 
多 利用 文件 系统 以 某 种 方式 连接 机 器 来 支持 分 发 服务 的 系统 被 开发 出 来 。 我 们 曾经 在 第 7 
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章 中 提 到 过 网 络 文件 系统 模型 ， 其 后 ,我 们 在 第 13 章 中 对 该 模型 进行 了 更 为 细致 的 分 析 研 
究 ， 为 此 我 们 在 这 里 不 再 重复 相关 讨论 。 网 络 文件 系统 支持 远程 机 器 上 的 目录 出 现在 本 地 系 
统 上 ， 就 像 它们 是 本 地 的 目录 一 样 ， 从 而 提供 位 置 透明 性 。 网 络 文件 系统 由 太阳 微 系 统 公司 
(Sun Microsystems) 在 UNIX 系列 操作 系统 上 开发 ， 故 而 目前 也 可 以 在 Mac 系列 操作 系统 
和 Linux 操作 系统 中 加 以 使 用 。 微 软 公司 也 为 NT 系列 较 高 版 本 的 操作 系统 提供 了 可 选 的 网 
络 文件 系统 客户 端 和 服务 器 的 支持 。 

微软 公司 还 提供 了 一 种 类 似 的 服务 ， 冠 以 通用 互联 网 文件 系统 ( Common Internet File 
System，CIFS) 和 服务 器 消息 块 (Server Message Block，SMB) 等 各 种 名 称 ， 它 们 均 类 似 于 
网 络 文件 系统 。 在 此 基础 上 ， 还 有 公司 基于 逆向 工程 技术 为 非 微软 操作 系统 开发 出 了 与 此 相 
兼容 的 客户 端 和 服务 器 ， 称 之 为 Samba。 

网 络 文件 系统 和 通用 互联 网 文件 系统 均 要 求 建立 从 客户 端 到 服务 器 之 间 的 不 透明 的 连 
接 ， 而 其 他 的 系统 则 是 为 了 使 得 有 关 过 程 更 加 透明 才 开 发 出 来 的 。 例 如 ， 微 软 公司 就 此 开发 
出 了 一 种 所 谓 的 分 布 式 文件 系统 ( Distributed File System，DFS)， 用 来 构建 文件 服务 器 和 共 
享 目录 的 分 层 式 视图 ， 从 而 使 它们 可 以 分 别 被 赋予 唯一 的 命名 。 于 是 ， 用 户 仅 仅 需 要 记 住 一 
个 名 称 ， 而 不 再 被 由 一 大 堆 不 同名 称 所 组 成 的 链接 搞 得 晕 头 转向 。 分 布 式 文件 系统 支持 服务 
器 复制 ， 同 时 将 会 为 一 个 客户 端 建立 其 到 达 最 近 可 用 的 文件 服务 器 的 路 由 。 分 布 式 文件 系统 
还 可 以 安装 在 集群 系统 上 ， 以 获得 更 好 的 性 能 和 可 靠 性 。 

,另外 也 有 一 些 其 他 的 不 太 广 泛 使 用 的 分 布 式 文件 系统 ， 其 中 特别 包括 安德鲁 文件 系统 
(Andrew File System，AFS) 和 内 容 分 发 体系 结构 ( COntent Delivery Architecture，CODA)， 
二 者 均 由 卡 内 基 梅 隆 大 学 所 开发 。 安 德 鲁 文件 系统 是 为 每 个 客户 端 工作 站 提供 一 个 同 构 的 、 
位 置 透明 的 文件 命名 空间 而 设计 的 。 内 容 分 发 体系 结构 作为 一 种 更 新 的 产品 ， 则 把 重点 放 在 
故障 恢复 和 断 开 连 接 操 作 (移动 计算 ) 方面 。 相 关系 统 只 有 在 UNIX 及 其 衍生 操作 系统 中 才 
得 到 支持 。 

还 有 ， 谷 歌 搜索 引擎 的 设计 也 严重 依赖 于 分 布 式 文件 系统 的 体系 结构 ， 其 在 所 有 系统 中 
都 提供 了 三 重 元 余 。 遗 憾 的 是 ， 对 于 我 们 来 说 ， 有 关 设 计 方案 是 专利 性 质 的 ， 尚 无 法 找到 多 
少 详细 的 相关 信息 可 以 使 用 。 


17.6 同步 


正如 我 们 在 第 9 章 中 所 见 到 的 那样 ， 对 于 由 诸多 模块 组 成 的 系统 来 说 ， 相 关 模 块 之 间 需 
要 同步 彼此 的 操作 。 而 就 分 布 式 系统 来 讲 ， 甚 至 需要 加 倍 努 力 才 能 够 实现 和 提供 相应 的 同步 
操作 。 在 此 ， 我 们 将 会 讨论 分 布 式 时 钟 〈 须 确保 时 钟 同步 )、 同 步 、 互 斥 、 协 调 器 选举 和 并 
发 控制 等 若干 种 机 制 。 


17.6.1 时钟 


在 许多 分 布 式 算法 中 ， 要 求 获悉 有 关 事 件 的 先后 次 序 。 壁 如 说 ， 如 果 有 两 个 人 几乎 在 
“同一 时 间 ” 从 银行 账户 执行 了 取款 操作 ， 那 么 我 们 往往 希望 在 实施 第 二 个 人 的 取款 操作 之 
前 就 已 经 完成 了 第 一 个 人 的 取款 操作 。 遗 憾 的 是 ， 光 速 限制 了 从 一 个 系统 到 另 一 个 系统 的 传 
输 时 间 。 因 此 ， 即 使 两 个 事件 的 的 确 确 是 在 同一 时 间 发 生 的 ， 也 只 能 到 一 段 时 间 之 后 才 可 能 
知道 这 一 点 。 除 此 之 外 ， 这 也 使 得 几乎 不 可 能 真正 确定 两 个 系统 上 的 时 钟 是 同步 的 。 幸 运 的 
是 ,通常 我 们 并 不 真正 关心 两 个 事件 发 生 的 实际 时 间 ， 我 们 只 是 关心 事件 发 生 的 先后 次 序 。 
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这 便 使 得 有 关 问 题 得 到 一 定 程度 的 简化 。 进 一 步 说 ,我 们 真正 需要 的 是 逻辑 时 钟 (logical 
clock)。 人 逻辑 时 钟 背后 的 想法 是 ， 存 在 某 事件 集 ， 对 于 其 中 的 事件 而 言 ， 我 们 主要 关注 的 是 
它们 发 生 的 先后 顺序 。 为 此 ， 在 每 个 系统 中 ， 每 当 有 事件 集中 的 某 个 事件 发 生 的 时 候 ， 我 
们 就 对 某 个 计数 器 执行 递增 操作 。 我 们 把 当时 的 计数 器 的 值 与 该 事件 相关 联 ， 称 为 时 间 惟 
(timestamp)。 这 便 形 成 了 我 们 即将 用 来 对 事件 进行 排序 的 逻辑 时 钟 。 对 于 两 个 事件 而 言 ， 如 
果 一 个 事件 的 时 间 戳 小 于 另 一 个 事件 的 时 间 戳 ， 那 么 我 们 就 认为 前 一 个 事件 是 在 另 一 个 事件 
之 前 发 生 的 。 

在 分 布 式 系 统 中 ， 我 们 还 必须 采取 另外 一 项 措施 。 也 就 是 说 ， 我 们 必须 要 关注 进程 之 间 
的 消息 。 我 们 希望 确保 消息 的 发 送 事件 是 在 相应 消息 的 接收 事件 之 前 发 生 的 。 为 此 ， 我 们 需 
要 把 消息 发 送 的 时 间 戳 与 另 一 个 进程 进行 关联 ， 并 且 将 该 逻辑 时 钟 值 与 对 应 消息 一 起 发 送出 
去 。 接 下 来 ， 当 该 消息 被 接收 到 时 ， 相 应 的 接收 系统 将 会 检查 伴随 消息 发 来 的 逻辑 时 钟 值 。 
如 果 传 人 消息 的 逻辑 时 钟 值 大 于 接收 进程 的 逻辑 时 钟 值 ， 那 么 接收 进程 应 当 把 自己 的 逻辑 
时 钟 设置 为 传人 消息 中 的 逻辑 时 钟 值 加 1， 从 而 表征 相应 消息 的 到 达 事 件 。 否 则 ， 接 收 进程 
只 是 简单 地 对 自己 的 逻辑 时 钟 执行 加 1 操作 以 表征 消息 的 到 达 。 这 种 机 制 称 为 兰 伯 特 时 间 惟 
(Lamport timestamp ) 。 

遗憾 的 是 ， 有 时 候 我 们 所 需要 的 比 这 还 要 复杂 。 通 常情 况 下 ， 我 们 需要 了 解 在 其 他 系统 
上 的 哪些 事件 可 能 会 对 传 入 消息 所 描述 的 事件 产生 影响 。 为 此 ， 用 来 记录 和 跟踪 分 布 式 系统 
中 的 所 有 进程 的 时 间 戳 的 机 制 是 为 每 个 事件 附着 上 一 个 时 间 惟 向量 〈 vector of timestamp ) 。 
该 时 间 截 向 量 的 索引 是 由 分 布 式 系统 分 配给 每 个 进程 的 一 个 编号 ， 并且 该 向 量 中 第 i 项 的 取 
值 就 是 我 们 所 获悉 的 关于 该 进程 的 最 新 的 时 间 戳 。 当 发 送 消息 时 ， 不 是 将 本 地 的 事件 计数 器 
的 取 值 作为 时 间 惟 进行 发 送 ， 而 是 把 该 进程 所 获悉 的 整个 时 间 惟 向量 与 消息 一 起 全 部 发 送出 
去 。 当 接收 系统 接收 到 相应 消息 时 ， 对 于 传人 消息 时 间 戳 向 量 元 素 取 值 大 于 其 自身 时 间 戳 向 
量 对 应 元 素 取 值 的 情况 ， 应 当 根 据 前 者 来 修正 和 更 新 后 者 。 


17.6.2 互 斥 


当 两 个 进程 协作 时 ， 它 们 经 常 需 要 同步 对 共享 数据 的 访问 ， 以 避免 相关 更 新 操作 的 冲 
突 问 题 ， 这 部 分 同步 称 为 互 斥 (mnutual exclusion ) 。 进 一 步 说 ， 在 每 个 进程 中 ,往往 会 包含 
一 个 称 为 临界 区 (critical region) 的 代码 段 ， 其 中 会 牵涉 相应 共享 信息 的 更 新 操作 。 我 们 在 
第 9 章 中 曾经 讨论 过 ， 这 通常 会 利用 上 锁 和 开锁 的 信和 号 量 来 加 以 实现 。 就 像 我 们 所 看 到 的 那 
样 ， 由 于 操作 系统 可 以 协调 上 锁 和 开锁 操作 ， 所 以 这 种 机 制 在 基于 单 处 理 器 运行 的 系统 中 能 
够 正常 运作 和 发 挥 效 用 。 然 而 ， 当 有 关 进 程 是 运行 在 彼此 独立 的 系统 上 时 ， 便 没有 哪个 单一 
的 操作 系统 可 以 来 实施 上 锁 和 开锁 操作 。 当 前 ， 针 对 分 布 式 系统 中 的 上 锁 和 开锁 操作 主要 设 
计 开 发 了 两 种 不 同 的 方法 ， 即 集中 式 锁定 机 制服 务 器 (centralized lock server) 和 分 布 式 锁定 
算法 。 集 中 式 锁定 机 制服 务 器 相当 简单 ， 具 体 就 是 创建 一 个 中 央 服 务 器 ， 同 时 将 所 有 的 上 锁 
和 开锁 操作 请 求 发 送 到 该 服务 器 上 ， 如 图 17-9 所 示 。 该 服务 器 采用 先 来 先 服务 的 原则 加 以 
运作 和 处 理 相关 请 求 。 

但 是 ， 集 中 式 锁 定 机 制服 务 器 是 故障 要 害 ( Single Point of Failure，SPoF ) 所 在 ， 同 时 也 
是 潜在 的 性 能 瓶颈 ， 因 此 有 时 采用 的 是 分 布 式 锁定 算法 ， 如 图 17-10 所 示 。 根 据 这 一 算法 ,和希 
望 进入 临界 区 的 进程 将 向 所 有 其 他 进程 发 出 关于 锁定 临界 区 的 许可 请 求 ， 并 在 有 关 请 求 中 包 
含 一 个 逻辑 时 钟 时 间 戳 。 如 果 接 收 到 请 求 的 进程 当前 不 想 访问 相应 的 临界 区 ， 那 么 它 便 可 以 
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立即 批准 请 求 者 进程 的 许可 请 求 。 但 如 果 接 收 到 请 求 的 进程 自身 也 想 访 问 相 应 的 临界 区 , 那 
么 它 将 会 比较 自己 的 时 间 戳 与 所 传人 请 求 的 时 间 惟 。 如 果 所 传人 请 求 的 时 间 戳 较 早 ,那么 它 
也 将 会 批准 请 求 者 进程 的 许可 请 求 。 和 否则 ， 它 将 在 自己 完成 相应 临界 区 的 使 用 之 后 才 会 批准 
请 求 者 进程 的 许可 请 求 。 在 图 17-10 中 ， 所 有 三 个 客户 端 都 想 在 自己 的 进程 中 访问 相关 的 临界 
区 。 客 户 端 3 向 所 有 其 他 的 客户 端 发 出 带 有 逻辑 时 钟 值 157 的 消息 。 客 户 端 1 自身 的 逻辑 时 
钟 值 为 155， 因 此 该 客户 端 将 会 延迟 对 客户 端 3 的 许可 请 求 的 批准 ， 直 到 其 自身 完成 对 临界 区 
的 访问 。 而 客户 端 2 将 会 直接 批准 客户 端 3 的 许可 请 求 ， 因 为 来 自 客户 端 3 的 请 求 拥有 比 其 
自身 更 低 的 逻辑 时 钟 值 。( 注 意 ， 该 图 中 并 未 给 出 源 自 客户 端 1 和 客户 端 2 的 许可 请 求 。) 





图 17-9 集中 式 锁 定 机 制服 务 器 图 17-10 分布 式 锁定 


17.6.3 选举 


如 果 分 布 式 系统 正在 使 用 集中 式 服务 器 的 相关 功能 ， 壁 如 在 上 一 节 中 所 提 到 的 锁定 机 制 
服务 器 功能 ， 那 么 需要 做 出 的 设计 决策 所 牵涉 的 一 个 问题 是 : 假设 任何 客户 端 都 可 能 提出 有 
关 操作 请 求 的 情况 下 ， 服 务 器 应 当 如 何 确定 和 执行 相应 的 操作 。 类 似 地 ， 在 某 些 算法 中 ,我 
们 往往 会 设立 一 个 进程 作为 有 关 算 法 的 协调 器 ( coordinator)。 在 大 多 数 情况 下 ， 服 务 吉 (或 
协调 器 ) 是 由 系统 管理 员 所 选 定 的 ， 然 后 有 关 功 能 便 运 行 在 相应 的 服务 器 (或 协调 器 ) 上 面 。 
但 是 ， 我 们 必须 要 考虑 到 ， 协 调 器 是 故障 要 害 所 在 。 如 果 我 们 感 兴 趣 的 是 一 个 总 体 上 更 为 可 
靠 的 系统 ， 那 么 我 们 有 必要 能 够 让 有 关 功 能 运行 在 不 止 一 处 地 方 ， 从 而 预防 主 站 点 出 现 故障 
或 无 法 访问 的 情况 。 为 此 ， 立 足 于 最 普 适 化 和 最 可 靠 的 考量 来 说 ， 就 应 当 是 允许 有 关 功 能 可 
以 运行 在 任何 地 方 。 所 以 ， 我 们 需要 动态 地 确定 哪个 进程 应 当 运 行 有 关 功 能 。 服 务 器 或 协调 
器 进程 的 动态 确定 被 称 为 选举 (election)。 而 通常 用 于 此 类 选举 操作 的 两 种 算法 是 强 者 算法 
(bully algorithm ) 和 令 牌 环 算法 (token ring algorithm )。 无 论 是 什么 样 的 选举 算法 ， 所 有 节 
点 均 需 分 别 拥 有 某 个 预先 指定 的 (关于 节点 自己 成 为 协调 器 的 ) 优先 级 ， 并 且 有 关 算 法 应 当 
选择 具有 最 高 优先 级 的 进程 作为 协调 器 。 

第 一 个 必须 要 探讨 的 问题 是 一 个 相对 简单 的 问题 ， 即 节点 是 如 何 决定 需要 一 次 选举 的 。 
一 般 而 言 ， 选 举 可 能 在 三 种 情况 下 需要 实施 : 当 一 个 节点 加 入 节点 组 的 时 候 、 当 网 络 故障 把 
整个 网 络 分 割 开 来 从 而 使 得 相应 节点 组 的 部 分 节点 无 法 连接 到 协调 器 的 时 候 以 及 当 协 调 器 发 
生 骨 溃 的 情况 下 。 当 一 个 节点 加 入 节点 组 时 ， 它 可 能 拥有 关于 自己 成 为 协调 器 的 最 高 优先 
级 ， 因 此 在 这 种 情况 下 ， 它 将 总 是 启动 运行 有 关 选 举 算法 。 对 于 其 他 两 种 情况 来 说 ， 相 关 进 
程 应 该 使 用 定时 器 来 检测 自身 与 协调 器 之 间 通 信 的 缺失 与 故障 问题 。 进 一 步 说 ， 如 果 定 时 器 
到 期 但 却 没 有 收 到 来 自 协 调 器 的 消息 ,那么 相应 进程 将 会 启动 选举 操作 。 为 此 ， 这 可 能 需要 
协调 器 在 没有 其 他 消息 要 发 送 的 情况 下 向 相应 节点 组 所 有 成 员 发 出 “连接 保持 ”的 通知 ， 从 
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而 使 得 其 他 节点 不 会 触发 不 必要 的 选举 操作 。 
在 强 者 算法 中 ， 每 个 进程 均 被 指定 了 一 个 优先 级 ， 而 且 需 要 启动 选举 操作 的 进程 将 会 向 
对 应 节点 组 中 的 所 有 其 他 进程 发 出 消息 ， 呈 上 它 自 己 的 优先 级 并 公布 自己 想 成 为 协调 器 的 意 
愿 。 接 下 来 ， 接 收 到 该 消息 的 任何 进程 ， 璧 如 P， 将 会 比较 所 传人 消息 中 给 定 的 优先 级 和 进 
程 P 自身 的 优先 级 的 大 小 。 
e 如 果 所 传 入 消息 中 的 优先 级 高 于 进程 P 自身 的 优先 级 ， 那 么 接收 者 进程 只 是 退出 相 
应 算法 即 可 。 
e 如 果 进 程 P 自身 的 优先 级 高 于 所 传人 消息 中 的 优先 级 ， 那 么 进程 P 将 会 给 以 消息 答 
复 ， 声 明 其 自身 的 优先 级 ， 于 是 最 初 发 送 消 息 的 那个 进程 从 算法 中 退出 。 
。 最 终 ， 获 胜 进程 将 会 向 整个 节点 组 发 出 广播 消息 ， 宣 布 其 协调 器 身份 。 
我 们 看 到 ， 在 图 17-11 中 ， 有 三 个 进程 发 出 了 关于 强 者 算法 的 消息 。 假 设 优先 级 1 为 最 高 优 
先 级 ， 那 么 相应 的 进程 将 会 在 该 算法 实施 过 程 中 脱颖而出 和 赢得 协调 器 身份 。 


(优先 级 1) [~~~~、: 我 入 先 级 1 遍 
A 和 的 间 
的 SS 
拥有 ”! ! 拥有 我 起 成 ; 范 级 3 拟 ~~、 
优先 级 1 1 ! 优先 级 人为 押 济 和 客户 端 
的 我 起 成 为 | 的 我 想 成 为 内 上 妇 3 的 (优先 级 3 ) 
协调 器 | | 协调 器 狗 有 成 为 出 调 路 
-一 也 御 贷 知 1 滑 脆 
客户 端 成 为 
(优先 级 2 本 
图 17-11 强 者 算法 


另 一 种 选举 算法 是 令 牌 环 算法 。 在 该 算法 中 ， 每 个 进程 被 设 定 了 一 个 数 ， 从 而 建立 起 了 
关于 逮 辑 环 中 的 一 种 次 序 。 每 个 进程 都 需要 了 解 整 个 环 的 次 序 。 发 起 选举 操作 的 进程 将 会 向 
其 所 认为 的 逻辑 环 中 的 下 一 个 进程 发 送 一 条 包含 其 自身 的 进程 号 和 优先 级 的 选举 性 消息 。 如 
果 它 没有 收 到 任何 答复 ， 那 么 它 将 会 把 这 一 消息 发 送 给 其 所 认为 的 逻辑 环 中 的 再 下 一 个 的 
进程 。 最 终 ， 肯 定 会 有 某 个 进程 对 此 消息 做 出 响应 。 该 响应 进程 将 会 在 此 消息 中 附 上 其 自身 
的 进程 号 和 优先 级 ， 并 继续 把 该 消息 传 向 环 中 的 下 
一 个 进程 ， 其 间 同 样 也 会 绕 过 因 发 生 故 障 而 失败 的 - 
任何 进程 。 当 这 一 消息 最 后 返回 到 当初 发 起 选举 操 |( 优先 
作 的 进程 时 ， 该 消息 将 会 包含 当前 所 有 的 进程 及 其 
对 应 优先 级 的 一 个 有 序 表 。 然 后 ， 这 一 最 终 形成 的 
消息 将 会 再 次 在 环 中 发 送 一 遍 。 因 此 ， 每 个 进程 将 
会 获悉 最 终 成 为 协调 器 的 进程 的 进程 号 以 及 整个 环 
的 全 部 次 序 。 相 关 过 程 如 图 17-12 所 示 。 其 中 ， 客 
户 端 A 率先 发 出 了 选举 性 消息 ， 而 客户 端 B 和 客户 
端 C 在 该 消息 在 环 中 传递 时 依次 向 该 消息 附着 上 了 
自身 的 标识 符 和 优先 级 。 当 该 消息 返回 到 客户 端 和 图 17-12 令 牌 环 选举 
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时 ,客户 端 A 将 会 获悉 自己 成 为 协调 器 。 于 是 ， 这 一 消息 将 会 在 环 中 再 次 被 发 送 一 遍 ， 从 
而 使 得 所 有 进程 都 将 知道 整个 节点 组 的 成 员 资格 以 及 对 应 于 环 中 的 次 序 。 


17.6.4 ”可靠 的 多 播 通信 


通常 情况 下 ， 协 作 进 程 组 要 求实 现 组 内 各 成 员 之 间 的 可 靠 的 通信 。 向 组 内 的 所 有 成 员 发 
送 一 条 消息 ， 并 且 不 会 把 该 消息 发 给 任何 其 他 的 实体 ， 这 被 称 为 多 播 9 ( multicast)。 遗 憾 的 
是 ， 除 了 单个 网 际 协议 网 络 内 部 的 多 播 外 ， 传 输 控制 协议 及 网 际 协议 并 不 支持 多 播 机 制 ， 而 
介质 访问 控制 层 的 多 播 也 仅仅 限于 单一 的 局 域 网 。 相 比 之 下 ， 用 户 数 据 报 协 议 倒是 支持 多 
播 ， 但 却 并 不 可 靠 。 因 此 ， 我 们 不 得 不 想方设法 在 应 用 层 探 索 更 为 可 靠 的 多 播 方案 。 在 所 有 
各 种 情况 下 都 可 以 正常 运作 和 发 挥 效用 的 唯一 机 制 是 ， 协 作 进程 组 的 每 个 成 员 均 需 拥有 一 条 
到 达 组 内 每 一 其 他 成 员 的 点 对 点 的 连接 。 这 在 互联 网 上 很 容易 就 能 够 做 到 ， 尽 管 对 于 大 型 的 
协作 进程 组 而 言 ， 其 伸缩 性 并 不 强 。 于 是 ， 当 一 个 进程 想 要 向 组 内 的 所 有 成 员 发 送 一 条 消息 
时 ， 它 只 是 通过 点 对 点 连接 把 有 关 消 息 发 送 给 每 个 成 员 。 考 虑 到 目前 在 较 低 网 络 层 中 的 可 用 
设施 ， 故 而 相关 繁琐 复杂 的 过 程 是 无 法 避免 的 。 如 果 我 们 想 要 确保 所 有 的 进程 都 会 看 到 所 有 
的 消息 ,那么 我 们 就 需要 使 用 某 种 确认 式 的 方法 。 我 们 可 以 使 用 传输 控制 协议 ， 毕 竟 其 内 置 
了 这 样 的 保证 。 然 而 ， 传 输 控 制 协议 对 此 来 说 却 是 非常 低 效 的 ， 并 且 无 法 很 好 地 延伸 和 扩展 
应 用 到 大 量 进程 的 情景 。 所 以 ， 我 们 宁愿 选择 用 户 数据 报 协议 并 且 自 己 来 实施 确认 。 当 然 ， 
这 仍然 必须 得 把 大 量 的 确认 (acknowledgment，ACK) 消息 回 发 给 发 送 者 进程 。 因 此 ， 知 干 
种 最 少 化 此 类 确认 消息 的 方法 得 以 设计 和 开发 出 来 。 其 中 ， 第 一 种 方法 依赖 于 当今 网 络 的 高 
可 靠 性 ， 而 且 只 有 当 接 收 者 进程 根据 所 传人 消息 的 序列 编号 推断 出 其 错失 了 某 条 消息 时 才 会 
发 送 所 谓 的 否定 应 答 (negative acknowledgment，NACK)。 在 图 17-13 中 ， 我 们 可 以 看 到 ， 
进程 D 向 其 他 进程 发 送 了 83 号 消息 ， 并 且 ， 进 程 C 根据 自己 之 前 所 接收 的 最 后 一 条 消息 是 
81 号 ， 从 而 获悉 自己 错失 了 82 号 消息 。 在 这 种 情况 下 ， 进 程 D 将 会 把 对 应 丢失 的 消息 重新 
发 送 给 所 有 错失 该 条 消息 的 接收 者 进程 。 当 然 ， 还 有 人 提出 了 一 些 其 他 的 改进 方案 ， 但 是 既 
未 引起 特别 的 注意 ， 也 未 得 到 广泛 有 效 的 利用 。 






图 17-13 “利用 否定 应 答 的 可 靠 多 播 通信 


日 从 理论 上 来 讲 ， 多 播 往往 包含 有 这 样 的 思想 ， 也 就 是 说 ， 有 关 消 息 只 会 向 对 应 网 络 中 发 送 一 次 ， 对 应 网 


络 会 把 有 关 消 息 同 时 递送 到 所 有 目标 位 置 ， 相 关 消 息 在 对 应 网 络 的 每 条 链 路 上 只 会 递送 一 次 ， 并 且 只 有 
在 到 达 目 标 位 置 的 链 路 被 断 开 时 才 会 创建 副本 。 不 过 ,我们 在 这 里 却 忽略 了 相关 优化 措施 。 
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17.6.5 ”分布 式 事务 

在 交互 式 系统 中 ， 我 们 经 常会 处 理 各 种 类 型 的 事务 ， 而 相关 事务 往往 会 牵涉 数据 库 的 知 
干 更 新 操作 。 典 型 的 例子 ， 如 关于 把 货品 从 一 个 仓库 ( A) 迁移 到 另 一 个 仓库 〈《B) 的 库存 事 
务 。 这 通常 需要 完成 如 下 几 个 步骤 : 

1 ) 读 取 仓库 A 中 相应 货品 的 数量 。 

2 ) 对 仓库 A 相应 货品 的 计数 执行 减 1 操作 ， 并 更 新 数据 库 中 对 应 表 项 计数 值 。 

3 ) 读 取 仓库 B 中 相应 货品 的 数量 。 

4 ) 对 仓库 B 相应 货品 的 计数 执行 加 1 操作 ， 并 更 新 数据 库 中 对 应 表 项 计数 值 。 

期 间 ， 如 果 系 统 碰 巧 在 第 2 步 完成 之 后 且 在 第 4 步 写 信之 前 因 发 生 了 故障 而 陷 人 了 毅 
泪 ， 那么 有 关 数 据 库 将 会 呈现 出 一 种 不 一 致 的 状态 (inconsistent state)。 换 句 话 说， 我 们 将 
会 遗漏 掉 库存 中 相应 一 件 货品 的 跟踪 记录 。 尽 管 我 们 可 以 通过 按照 相反 的 顺序 来 执行 这 两 个 
更 新 操作 ， 从 而 避免 遗漏 对 任何 货品 的 跟踪 ,但 是 那样 ,我们 又 会 承担 上 “ 误 以 为 我 们 额外 
添置 了 一 件 货 品 ” 的 风险 。 一 般 来 说 ， 此 类 问题 可 以 通过 所 谓 事务 (transaction) 的 机 制 来 
予以 避免 。“ 事 务 ”似乎 是 一 个 重 载 性 质 的 术语 ， 因 为 我 们 时 常 使 用 这 一 词语 来 表示 用 户 可 
能 想 要 对 系统 完成 的 事情 。 不 过 话 又 说 回来 ， 相 关 过 程 与 我 们 在 这 里 看 到 的 步骤 非常 相似 。 
大 多 数 的 用 户 事务 往往 都 会 涉及 对 多 个 文件 或 多 个 数据 库 表 的 更 新 ， 并 且 我 们 希望 整个 系统 
可 以 正确 无 误 地 反映 我 们 正在 记录 的 结果 。 我 们 认为 这 种 类 型 的 更 新 是 原子 (atomic) 性 质 
的 ， 也 就 是 说 ， 所 有 步骤 要 么 全 部 被 实施 和 正式 存档 要么 直接 被 全 部 丢弃 ， 即 便 系统 崩 
溃 是 在 更 新 操作 序列 期 间 发 生 的 。 当 进程 要 实施 这 样 的 一 系列 更 新 操作 时 ， 它 会 发 起 一 个 应 
用 程序 接口 (API) 调用 来 启动 事务 ( transaction start)。 而 当 每 项 更 新 信息 写 人 数据 库 的 时 
候 ， 有 可 能 成 功 ， 也 有 可 能 失败 。 故 而 ， 数 据 库 系 统 将 会 以 临时 方式 来 执行 这 些 更 新 操作 ， 
也 就 是 说 ， 采 用 一 种 认为 相应 更 新 操作 是 正在 进行 但 尚未 完成 的 方式 来 把 对 应 更 新 结果 写 入 
数据 库 中 。 如 果 其 间 的 任何 更 新 操作 被 拒绝 ， 那 么 相应 进程 将 会 发 起 事务 天 折 ( transaction 
abort， 或 称 为 事务 中 止 ) 的 系统 调用 ， 于 是 数据 库 将 会 清除 掉 所 有 的 临时 更 新 结果 。 但 如 果 
所 有 的 更 新 步骤 均 告 成 功 ， 那 么 相应 进程 将 会 发 起 事务 提交 (transaction commit) 的 系统 调 
用 ， 故 而 数据 库 系 统 将 会 提交 相关 更 新 结果 ， 实 现 持久 更 新 ， 同 时 删除 先前 的 任何 临时 记录 。 

在 拥有 分 布 式 数 据 库 的 系统 中 ， 相 关 操 作 非 常 类 似 。 但 是 ， 由 于 单个 事务 可 能 会 牵涉 
香干 不 同 的 数据 库 服务 器 的 协作 ， 而 从 更 新 操作 调用 发 起 之 后 的 过 程 当 中 ， 有 可 能 其 中 的 某 
个 进程 已 经 发 生 了 故障 ， 所 以 有 关 提 交 过 程 往往 会 略微 复杂 些 。 进 一 步 说 ， 其 间 ， 可 能 是 管 
理 分 布 式 数据 库 相 关 要 素 的 某 一 个 进程 发 生 了 崩 江 ,或 是 相应 网 络 发 生 了 故障 ， 故 而 我 们 无 
法 与 对 应 进程 开展 通信 。 无 论 是 哪 一 种 情况 ， 有 关 操 作 都 将 无 法 继续 执行 。 对 于 拥有 非 分 布 
式 数据 库 的 系统 来 说 ， 是 不 可 能 以 这 种 分 离 的 方式 失败 的 。 于 是 ,为 了 支持 和 适应 这 样 的 情 
况 ， 分布 式 事务 处 理 便 建 立 在 所 谓 的 两 阶段 提交 (two-phase commit) 的 协议 上 。 我 们 将 会 
在 下 一 节 讨论 有 关 协 议 。 

关于 分 布 式 数 据 库 相 关 事 务 的 另 一 个 问题 是 ， 为 了 提高 性 能 ， 数 据 库 往往 会 试图 交错 
处 理 针对 相同 数据 表 的 但 来 自 不 同 进 程 的 更 新 操作 。 只 要 没有 两 个 进程 是 在 试图 更 新 相同 的 
数据 ， 那么 便 不 存在 任何 冲突 问题 ， 故 而 相关 操作 可 以 采用 交织 方式 向 前 推进 。 但 如 果 有 
两 个 进程 试图 同时 更 新 相同 的 数据 ， 那 么 其 中 的 一 项 操作 应 当 被 拒绝 。 注 意 ， 在 这 一 点 上 ， 
被 拒绝 的 应 用 程序 的 最 佳 选择 是 简单 地 重新 尝试 相应 操作 。 但 是 ， 这 种 情况 在 单 处 理 系统 
(uniprocessing system) 中 不 可 能 出 现 ， 因 此 其 违背 了 分 布 的 透明 性 。 
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17.7 ”容错 

在 我 们 关于 透明 性 的 讨论 中 ， 我 们 曾经 说 过 ， 其 中 的 二 项 目标 就 是 让 故障 对 用 户 是 透明 
的 。 对 于 分 布 式 应 用 程序 容错 能 力 的 提升 ， 可 以 采用 许 许多 多 的 机 制 ， 不 过 ， 它 们 大 多 都 与 
元 余 密 切 相 关 。 


17.7.1 概述 


与 单一 系统 中 的 故障 相 比 ， 分 布 式 系统 中 的 故障 是 一 个 更 为 复杂 的 问题 。 当 单一 系统 
出 现 故 障 时 ， 整 个 系统 都 将 停 下 来 。 而 当 分 布 式 系统 发 生 故 障 时 ， 其 中 只 会 有 一 部 分 可 能 停 
下 来 。 鉴 于 相关 部 件 彼此 之 间 往 往 未 必 会 不 断 地 发 生 通信 ， 所 以 ， 首 要 的 问题 就 是 让 各 种 各 
样 的 部 件 设法 推断 和 能 够 确定 男 一 部 件 已 经 黑 工 和 不 再 运作 。 但 这 件 事情 做 起 来 却 可 能 非常 
棘手 。 通 常情 况 下 ， 我 们 会 从 使 用 超时 的 想法 出 发 来 着 手 处 理 。 当 客户 端 请 求 服务 器 完成 某 
项 事情 的 时 候 ， 它 往往 会 启动 一 个 定时 器 。 如 果 在 某 个 确定 的 时 间 期 限 内 没有 得 到 答复 ， 那 
么 该 客户 端 便 可 以 推断 相应 的 服务 器 已 经 罕 机 。 然 而 ， 有 关 服 务 器 可 能 并 没有 宕 机 ， 也 可 能 
是 发 生 了 网 络 问题 使 得 服务 器 当前 无 法 访问 。 璧 如 说 ， 在 网 络 中 的 某 个 节点 处 可 能 出 现 了 通 
信 流 量 的 又 增 ， 从 而 使 得 其 间 的 路 由 器 不 得 不 丢弃 掉 了 相应 的 请 求 或 者 应 答 结 果 。 再 比如 
说 ， 也 可 能 是 当前 服务 器 超载 运行 ， 尽 管 有 关 操 作 已 经 执行 ， 但 是 相关 应 答 结果 却 尚 未 发 送 
或 者 仍 在 传输 过 程 中 。 在 这 种 情况 下 ， 如 果 我 们 重新 尝试 有 关 操 作 ， 反 而 可 能 会 导致 问题 的 
发 生 。 进 一 步 说 ， 如 果 有 关 操 作 是 从 库存 计数 中 减 去 一 件 货品 ,我 们 肯定 不 希望 重复 这 一 操 
作 。 不 过 ,， 话 又 说 回来 ， 如 果 我 们 只 是 统计 库存 数量 ， 然 后 把 计数 变量 设置 为 我 们 所 获悉 的 
仓库 中 所 包含 的 货品 数量 值 ， 那 么 重复 此 类 请 求 不 会 造成 任何 问题 ， 当 然 前 提 条 件 是 期 间 没 
有 发 生 过 库存 的 其 他 更 改 。 我 们 把 后 一 类 操作 称 作 是 震 
等 的 (idempotent)。 具 体 而 言 ， 窜 等 性 质 的 操作 将 以 这 
样 的 一 种 方式 来 执行 存档 ， 即 其 可 以 重复 执行 但 不 会 改 
变 结果 。 值 得 注意 的 是 ， 如 果 我 们 将 减法 操作 记录 为 旧 
值 的 读 取 和 新 值 的 写 人 ， 那 么 这 也 将 是 备 等 性 质 的 。 


17.7.2 ”进程 韧性 


通过 把 相关 功能 分 布 到 运行 在 不 同系 统 上 的 多 个 进 
程 上 ， 我 们 就 能 够 使 这 些 功能 更 为 健壮 。 也 就 是 说 ， 如 
果 有 某 个 进程 发 生 了 问题 ， 其 他 进程 可 以 继续 正常 运 
行 。 我 们 谈 到 这 样 的 系统 时 ， 称 其 拥有 进程 组 ( process 
group )。 进 程 组 可 以 组 织 成 分 层 式 进程 组 ( hierarchical 
group， 如 图 17-14 所 示 )， 也 可 以 组 织 成 平坦 型 进程 
组 (flat group， 如 图 17-15 所 示 )。 对 于 分 层 式 进程 组 
而 言 ， 会 有 一 个 进程 作为 协调 器 ， 而 其 他 进程 均 需 通过 
点 对 点 链接 方式 向 协调 器 进程 提交 报告 。 拥 有 唯一 的 一 
个 协调 器 进程 意味 着 该 进程 组 将 会 存在 单 点 故障 要 害 问 
题 ， 就 像 我 们 在 上 一 节 中 所 看 到 的 那样 ， 尽 管 我 们 可 以 
选举 产生 新 的 协调 器 进程 。 但 在 选举 期 间 (以 及 识别 故 
障 所 需 的 超时 期 限 过 程 中 )， 相 应 进程 组 基本 上 是 不 起 图 17-15 平坦 型 进程 组 
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作用 的 ， 故 而 整个 系统 将 会 变 得 不 太 稳定 。 总 体 上 来 说 ， 此 类 系统 比较 容易 实现 ， 并 且 相关 
通信 开销 也 不 大 。 

对 于 平坦 型 进程 组 而 言 ， 相 关 控 制 分 布 遍及 整个 进程 组 。 每 个 进程 与 其 他 各 进程 之 间 直 
接 进行 通信 。 因 此 ， 相 应 的 通信 开销 远 远大 于 分 层 式 进 程 组 的 通信 开销 。 不 过 ， 这 种 进程 组 
方式 健壮 性 更 强 ， 因 为 单 点 故障 不 会 导致 整个 进程 组 的 失效 。 当 然 ， 这 样 的 系统 实现 起 来 要 
比分 层 式 进程 组 复杂 许多 。 


17.7.3 ”可 靠 的 客户 端 - 服务 器 通信 


前 面 我 们 曾经 说 过 ， 如 果 服 务 器 无 法 正常 响应 ， 那 么 客户 端 需要 做 出 一 些 特 殊 的 考虑 和 
判断 。 壁 如 说 ,我 们 可 能 不 希望 重新 发 送 有 关 请 求 ， 因 为 我 们 不 想 让 有 关 操 作 再 执行 一 遍 。 
同样 ， 如 果 服 务 器 发 生 了 崩 演 ， 我 们 将 会 陷入 左 右 为 难 的 境地 ， 因 为 我 们 并 不 真正 清楚 对 应 
服务 器 是 否 已 经 接收 到 了 有 关 请 求 、 是 否 对 请 求 进行 了 处 理 以 及 是 否 是 在 能 够 发 出 应 答 之 前 
骨 溃 的 。 但 是 ， 有 时 候 ， 根 据 有 关 请 求 采 取 行 动 却 是 非常 重要 的 。 或 许 我 们 可 能 正在 发 出 火 
灾 报 警 ， 不 止 一 次 地 发 出 这 样 的 报警 并 不 是 一 个 大 的 问题 。 这 种 情形 被 称 为 至 少 一 次 性 语义 
(at least once semantic) 。 当 然 ， 也 有 一 些 时 候 ， 有 关 请 求 特别 不 希望 被 发 送 一 次 (不 含 一 次 ) 
以 上 。 就 此 不 妨 想象 一 下 ， 从 我 们 的 银行 账户 支付 一 笔 账单 的 请 求 ! 我 们 肯定 不 希望 这 种 情 
况 的 发 生 超过 一 次 。 这 种 情形 被 称 为 至 多 一 次 性 语义 ( at most once semantics)。 对 于 其 他 的 
情况 ,我 们 或 多 或 少 抱 持 一 种 无 关 紧 要 的 态度 一 一 譬如 ， 对 于 发 给 证 券 报价 机 的 请 求 ， 无 非 
是 列 出 股票 的 最 新 交易 行情 而 已 ， 多 发 一 次 请 求 或 者 少 发 一 次 请 求 都 无 所 谓 。 这 种 情形 被 称 
为 不 保证 性 语义 (no guarantee semantics)。 最 后 ， 我 们 希望 有 关中 间 件 最 好 能 够 保证 事务 恰 
好 被 处 理 一 次 (exactly once)。 对 于 中 间 件 来 讲 ， 要 达到 这 种 级 别 的 保证 是 有 可 能 实现 的 ， 
但 是 将 会 需要 大 量 的 日 志和 复核 (double-checking)， 所 以 实现 起 来 代价 会 比较 昂贵 。 总 的 来 
说 ， 我 们 必须 要 针对 每 种 类 型 的 事务 分 别 展开 深入 细致 的 分 析 ， 从 而 确认 应 当 采 取 和 授权 什 
么 级 别 的 语义 保证 。 


17.7.4 分布 式 提 交 


在 前 面 的 一 节 中 讨论 分 布 式 事务 的 时 候 ， 我 们 曾 提 到 过 一 个 分 布 式 提 交 的 概念 。 而 在 这 
里 所 讨论 的 有 关 算 法 则 与 故障 透明 性 相关 ， 所 以 是 单独 分 开 的 ， 其 被 称 为 两 阶段 提交 算法 。 
具体 而 言 ， 有 一 个 进程 将 会 作为 整个 算法 的 协调 器 。 该 协调 器 进程 将 会 向 其 余 每 个 进程 发 送 
一 条 消息 ， 向 那些 进程 征询 它们 是 否 可 以 提交 相应 所 请 求 的 更 新 结果 。 如 果 所 有 进程 处 于 正 
常 运行 状态 而 且 网 络 运作 没有 问题 ， 那 么 相关 进程 都 将 返回 肯定 的 答复 ， 于 是 协调 器 接 下 来 
便 会 通知 全 体 进程 应 当 提 交 更 新 结果 了 。 但 如 果 有 任何 进程 发 生 了 故障 或 者 网 络 不 能 正常 运 
行 ， 那么 协调 器 将 至 少 不 会 从 一 个 进程 那里 接收 到 肯定 的 答复 ， 因 此 这 一 消息 应 答 过 程 最 终 
将 超过 时 限 ， 故 而 协调 器 将 会 向 其 余 每 个 进程 发 送 一 条 中 止 请 求 。 如 果 有 进程 发 生 了 衣 溃 ， 
还 会 引发 一 些 复杂 的 问题 。 壁 如 说 ， 当 发 生 故 障 的 进程 重新 启动 时 ， 它 可 能 通过 检查 日 志文 
件 了 解 到 其 当时 所 处 的 状态 (例如 正 处 于 提交 操作 的 过 程 当 中 )。 为 此 ， 相 应 进程 接 下 来 所 需 
完成 的 事情 将 会 取决 于 其 在 发 生出 演 时 所 处 的 状态 。 如 果 它 正 处 于 中 止 状态 ,那么 其 仅仅 需 
要 中 止 相应 操作 即 可 。 类 似 地 ， 如 果 它 正 处 于 提交 状态 ， 那 么 它 应 当 继 续 相 应 提交 过 程 。 以 
上 这 些 状 态 只 有 在 得 到 协调 器 相应 指示 的 情况 下 才 会 进入 。 如 果 正 在 恢复 的 进程 处 于 就 绪 状 
态 ， 且 正 等 竺 和 监听 来 自 于 协调 器 的 指示 ， 那 么 它 只 需要 请 求 协调 器 重复 发 送 相 应 指令 即 可 。 

当 协 调 器 发 生 骨 溃 时 ， 问 题 便 比较 严重 了 。 在 这 种 情况 下 ， 其 他 相关 进程 与 协调 吉之 间 
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的 通信 将 会 超时 ， 从 而 使 有 关 问 题 被 暴露 和 发 现 。 进 一 步 说 ， 如 果 有 关 进 程 正 处 于 中 止 或 提 
交 状 态 ， 那 么 其 接 下 来 会 按部就班 地 采取 相应 的 行动 。 而 如 果 有 关 进 程 正 处 于 就 绪 状 态 ， 那 
么 它 是 无 法 自己 告诉 自己 去 做 什么 事情 的 ， 于 是 它 便 会 询问 其 他 所 有 进程 所 处 的 状态 情况 。 
如 果 任 何其 他 进程 答复 说 正 处 于 中 止 或 提交 状态 ， 那么 便 意味 着 协调 器 在 发 生 崩 演 之 前 就 已 
经 做 出 决定 并 且 已 经 启动 发 出 了 相应 的 指令 ， 于 是 所 有 这 些 进程 还 是 可 以 按部就班 地 采取 相 
应 的 行动 。 

当然 ， 也 存在 小 概率 的 因为 协调 器 在 发 送 提交 消息 之 前 就 已 经 崩溃 故而 有 关 算 法 可 能 挂 起 
的 情况 。 为 此 ， 设 计 和 开发 形成 了 这 一 算法 的 衍生 版 ， 即 三 阶段 提交 ( three-phase commit) 算 
法 。 但 在 实践 过 程 当中 ， 这 种 情况 是 非常 罕见 的 ， 故 而 三 阶段 提交 算法 几乎 从 未 真正 使 用 过 。 


17:8 小 结 


分 布 式 系统 ， 如 果 不 是 已 经 ， 也 将 很 快 成 为 规范 ， 而 不 再 是 特例 或 例外 情况 。 本 章 首 先 
回顾 了 关于 为 什么 我 们 会 发 现 分 布 式 系统 一 天 天 愈加 常见 的 一 系列 缘由 。 其 间 ， 我 们 还 解释 
了 分 布 透明 性 的 概念 ， 引 入 了 中 间 件 的 思想 ,并 阅 明 了 中 间 件 采取 相应 形式 的 理由 所 在 。 在 
此 基础 上 ,我们 介绍 了 经 常 和 分 布 式 系统 一 起 使 用 的 几 种 不 同 的 模型 包括 客户 端 - 服务 
器 模型 、 三 层 模 型 、N 层 模型 以 及 水 平分 布 模型 。 接 下 来 ， 在 第 17.3 节 ， 我 们 重 温 了 进程 
和 线程 的 相关 原理 ， 并 就 致力 于 客户 端 和 服务 器 执行 性 能 更 好 或 者 至 少 看 起 来 更 为 高 效 的 目 
标 ， 如 何在 分 布 式 系统 中 使 用 线程 的 方案 进行 了 解释 说 明 。 鉴 于 分 布 式 系统 中 的 进程 需要 通 
信 ， 为 此 ， 它 们 需要 引用 其 他 的 实体 。 所 以 ， 我 们 在 第 17.4 节 中 论述 了 命名 和 命名 空间 的 
概念 。 在 第 17.5 节 中 ， 我 们 介绍 了 分 布 式 系统 的 一 些 不 同 范例 ， 包 括 远程 过 程 调用 、 分 布 
式 对 象 、 分 布 式 文档 以 及 分 布 式 文件 系统 。 与 单一 系统 相 比 ， 分 布 式 系统 在 同步 方面 拥有 一 
些 特 殊 的 颇 为 不 同 的 问题 ， 所 以 我 们 紧 接 着 讨论 了 分 布 式 系统 中 的 同步 机 制 。 第 17.7 节 的 
内 容 主要 围绕 容错 展开 ， 这 对 于 分 布 式 系统 来 说 同样 存在 一 些 特殊 的 问题 ， 因 为 其 中 某 个 部 
件 发 生 故障 之 后 ， 系 统 的 其 余部 分 应 当 能 够 继续 正常 运行 。 

在 本 书 的 最 后 一 部 分 中 ， 我 们 将 审视 一 些 重 要 的 现代 操作 系统 ， 就 那些 我 们 在 面向 深度 
的 主题 章节 中 所 描述 的 一 些 功能 特征 在 相关 操作 系统 中 的 实现 机 制 展开 进一步 的 分 析 讨 论 。 
其 中 某 些 操作 系统 曾经 在 第 二 部 分 中 做 过 介绍 ， 但 其 间 我 们 仅仅 讨论 了 相应 操作 系统 为 支持 
给 定 级 别 的 功能 特征 所 需 拥有 的 功能 类 型 。 在 本 书 的 第 六 部 分 ， 我们 将 更 为 细致 地 对 其 中 的 
一 些 操作 系统 进行 深入 的 剖析 ， 阐 明 它 们 是 如 何 运 用 我 们 已 经 讨论 过 的 有 关机 制 的 。 
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网 上 资源 


http://www.opengroup.org/dce/ ( 开放 软件 基金 会 的 Consortium, W3C ) 


分 布 式 计算 环境 (DCE ) ， 关 于 远程 过 程 调 http://www-306.ibm.com/software/lotus/( 其 他 分 布 式 
用 的 一 种 实现 方案 ) 产品 ， 包 括 Lotus Notes 和 Symphony ) 


http:/www.w3.ors (万 维 网 联盟 ( World Wide Web http://en.wikipedia.org/wiki/Two-phase_commit 


关于 为 什么 分 布 式 系统 被 发 现 越 来 越 常见 的 原因 ， 我们 在 本 章 共 列 出 了 8 条 理由 。 请 说 出 这 8 
条 理由 中 的 4 条 。 

我 们 列 出 了 分 布 式 系 统 在 理想 情况 下 应 当 对 用 户 透 明 的 9 个 方面 。 请 给 出 其 中 的 5 个 方面 。 
简要 描述 中 间 件 的 定义 。 

我 们 介绍 了 用 于 构建 分 布 式 系统 的 4 种 模型 。 其 中 哪 种 模型 是 万 维 网 的 基础 ? 

添加 到 万 维 网 模型 中 从 而 派生 形成 三 层 模 型 的 那 一 层 是 什么 

根据 谷歌 的 理解 ， 分 布 式 系统 模型 的 进一步 泛 化 结果 称 为 什么 ? 

本 章 还 描述 了 一 种 称 为 水 平分 布 的 不 同类 型 的 模型 。 请 举例 说 明 利 用 这 种 模型 所 描述 的 系统 类 型 。 
早期 使 用 1.0 版 超 文 本 传输 协议 的 网 络 浏览 器 必须 得 打开 一 个 单独 的 连接 才能 够 检索 网 页 上 所 
引用 的 各 个 组 件 。 是 采用 了 什么 技术 才 使 有 关 操 作 变 得 更 为 高 效 的 ? 

请 描述 通常 情况 下 服务 器 使 用 线程 的 两 种 方式 。 

当 物 理 虚 拟 机 上 的 主机 操作 系统 加 载 客 户 机 操作 系统 时 ， 它 是 如 何 确保 主机 操作 系统 保持 享有 
对 整个 系统 的 控制 权 的 ? 

简要 描述 抽象 虚拟 机 的 操作 机 理 。 

对 于 Jini 设计 而 言 ， 无 须 事先 了 解 有 关 服 务 所 使 用 的 网 络 机 制 ， 便 可 允许 应 用 程序 访问 相应 的 
服务 。 这 是 否 正确 ? 

关于 为 什么 移动 实体 使 用 网 际 协议 会 成 为 问题 的 基本 原因 是 什么 ? 

关于 我 们 所 审视 的 中 间 件 的 一 项 应 用 ， 就 是 支持 我 们 利用 现 有 的 程序 ， 并 将 其 中 的 部 分 模块 迁 
移 到 另 一 个 系统 上 。 为 做 到 这 一 点 ， 相 应 的 非 面向 对 象 的 设计 方案 是 什么 ? 

我 们 把 开发 分 布 式 对 象 系统 的 主要 标准 称 为 什么 ? 

在 接收 消息 时 ， 兰 伯 特 时 间 戳 机 制 是 如 何 确保 本 地 逻辑 时 钟 正确 反映 关于 分 布 式 系统 中 事件 发 
生 顺 序 的 相关 信息 的 ? 

集中 式 机 制 是 如 何 运作 和 支持 分 布 式 系统 中 的 互 斥 的 ? 

用 于 选举 一 个 系统 的 协调 器 进程 的 两 种 不 同 的 分 布 式 算 法 是 什么 ? 

传输 控制 协议 支持 互联 网 上 的 可 靠 的 多 播 通信 。 这 是 否 正确 ? 

为 什么 分 布 式 系统 中 的 数据 库 事务 更 加 难以 处 理 ? 
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| 第 六 部 分 


Operating Systems: A Spiral Approach 


实例 研究 





本 书 的 前 两 部 分 为 我 们 阐释 了 一 些 最 初 的 背景 ， 并 按照 我 们 所 称 的 “螺旋 式 
方法 ”介绍 了 一 系列 较为 复杂 的 操作 系统 。 采 用 螺旋 式 方法 的 目的 在 于 凸显 所 探 
讨 的 功能 特征 的 动机 ， 并 对 相关 素材 给 以 更 为 客观 的 认识 。 接 下 来 的 三 个 部 分 则 
深入 地 解释 了 操作 系统 所 涉及 的 各 种 各 样 的 技术 内 容 。 在 这 一 部 分 ， 我 们 将 以 实 
例 研 究 的 形式 再 次 转向 真实 的 操作 系统 。 我 们 将 会 更 加 细致 深入 地 阐述 几 种 现代 
操作 系统 是 如 何 整合 和 实现 第 三 一 五 部 分 中 所 描述 的 相关 功能 的 。 

第 18 章 涵盖 Windows NT 系列 操作 系统 ， 从 其 第 一 个 发 行 版 本 开始 ， 一 直到 
现在 称 为 Vista 的 版 本 。 其 间 还 包含 一 些 相 关 历 史 材 料 以 为 学 生 提供 较为 客观 的 审 
查 视 角 。 本 章 中 的 其 他 主题 则 分 别 讨论 了 单 用 户 操 作 系统 环境 、 进 程 调度 、 内 存 管 
理 、 文 件 支持 、 基 本 输入 /输出 、 图 形 化 用 户 接口 编程 、 网 络 、 对 称 多 处 理 ， 以 及 
后 续 版 本 提升 启动 速度 的 重要 意义 和 关于 Vista 版 本 中 新 的 功能 特征 的 一 些 点 评 。 

第 19 章 围 绕 Linux 操作 系统 展开 ， 涵 盖 了 教材 第 二 部 分 并 未 触及 的 其 他 主 
题 ， 以 及 该 系统 是 如 何 实现 我 们 期 望 在 任何 现代 操作 系统 中 所 看 到 的 一 些 标准 功 
能 的 。 在 简要 回顾 Linux 操作 系统 之 后 ， 我 们 讨论 了 Linux 系统 的 内 存 管 理 功能 
以 及 文件 系统 组 织 。 这 一 章 还 介绍 了 Linux 系统 的 基本 输入 /输出 功能 、 对 图 形 
化 用 户 接口 编程 的 支持 、 对 网 络 的 支持 以 及 对 称 多 处 理 机 制 。 在 此 基础 上 ， 我 们 
还 介绍 了 由 Linux 衍生 形成 的 一 些 很 有 意思 的 操作 系统 ， 主 要 是 硬 实时 系统 。 

第 20 章 讨 论 了 Palm 操作 系统 的 其 他 主题 ， 主 要 包括 该 操作 系统 在 螺旋 式 
方法 部 分 未 曾 提 及 的 其 他 很 有 意思 的 功能 、 与 此 类 系统 打交道 时 所 需要 的 编程 环 
境 、 手 机 市 场 的 类 似 开发 以 及 它们 与 掌上 电脑 市 场所 形成 的 对 比 。 最 后 ， 该 章 还 
讨论 了 正在 为 这 些 操作 系统 所 开发 的 新 型 应 用 程序 其间 窑 涉 移 动 平台 特性 以 及 
对 操作 系统 功能 特征 的 影响 。 
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在 这 一 章 ， 我 们 将 讨论 一 个 从 安装 数量 来 说 占据 绝对 第 一 位 置 的 个 人 计算 机 操作 系统 家 
族 ， 即 由 微软 公司 开发 的 Windows NT 系列 操作 系统 。 对 于 普通 的 观察 人 员 来 说 ， 该 操作 系 
统 似乎 每 次 只 能 支持 一 个 用 户 来 使 用 个 人 计算 机 的 控制 台 。 然 而 ， 该 操作 系统 实际 上 可 以 支 
持 远程 终端 上 的 多 个 用 户 。 它 还 通过 运行 各 种 远程 访问 的 功能 (如 文件 、 打 印 和 目录 服务 ) 
来 支持 多 个 并 发 用 户 ， 同 时 也 可 用 作 诸 如 数据 库 、 超 文本 传输 协议 服务 器 或 网 站 服务 器 、 文 
件 传输 协议 服务 器 、 网 络 服务 以 及 许多 其 他 高 级 服务 的 运行 平台 。 在 更 高 版 本 中 ， 该 操作 系 
统 还 支持 所 谓 快速 用 户 切 换 的 功能 。 这 一 功能 允许 一 个 用 户 从 系统 中 注销 ， 而 正在 运行 的 任 
何 应 用 程序 都 将 继续 保留 在 内 存 中 。 然 后 ， 另 一 个 用 户 就 可 以 登录 并 启动 运行 另外 的 应 用 程 
序 。 同 样 ， 第 二 个 用 户 也 可 以 注销 ， 同 时 让 所 有 的 应 用 程序 保持 运行 。 这 时 候 ， 第 一 个 用 户 
可 以 重新 登录 返回 系统 并 从 上 次 停 下 的 地 方 继续 工作 ， 其 间 并 不 需要 重新 启动 相应 的 那些 应 
用 程序 。 

虽然 本 章 的 标题 直接 提 到 了 Vista， 但 我 们 采用 术语 Windows NT 来 指 代 相应 整个 操作 
系统 系列 产品 。 严 格 讲 ， 这 一 术语 仅仅 适用 于 3.1、3.5、3.51 和 4.0 发 行 版 本 的 NT 操作 系 
统 。 尽 管 如 此 ， 有 关 产 品系 列 命 名 不 尽 相 同 ， 而 就 绝 大 多 数 的 Windows 操作 系统 而 言 ， 相 
关 发 行 版 本 之 间 的 差异 对 我 们 来 说 并 不 重要 。 男 外 ， 术 语 NT 通常 用 于 指 代 相应 整个 版 本 系 
列 ， 故 而 我 们 也 将 按 这 种 方式 来 使 用 它 。 而 如 果 我 们 提 到 在 特定 版 本 中 某 些 功能 特征 的 删 减 
或 增加 ， 我 们 就 可 能 说 明 特 定 版 本 的 产品 名 称 。 

在 本 章 的 开始 部 分 ， 我 们 将 概要 介绍 NT 操作 系统 以 及 各 种 各 样 的 Windows 操作 系统 
发 展 历史 相关 的 一 些 背 景 ， 以 便 提炼 出 关于 各 种 功能 特征 和 设计 决策 的 某 些 观点 。 在 第 18.2 
节 中 ， 我 们 讨论 了 典型 的 NT 操作 系统 环境 的 本 质 所 在 ， 同 时 还 就 NT 操作 系统 的 主要 目 
标 一 一 多 硬件 平台 的 支持 和 传统 Windows 操作 系统 应 用 程序 的 支持 进行 了 讨论 。 

NT 操作 系统 支持 许多 同时 运作 的 用 户 进程 以 及 并 发 执行 的 服务 器 功能 ， 因 此 在 第 18.3 
节 中 ， 我 们 讨论 了 NT 操作 系统 中 的 进程 和 任务 的 调度 。NT 操作 系统 利用 辅助 存储 器 作为 
主 存储 器 的 扩展 ， 因 此 需要 复杂 的 内 存 处 理 机 制 。 这 些 将 会 在 第 18.4 节 中 加 以 讨论 。 同 时 ， 
支持 诸多 服务 器 功能 和 多 个 用 户 的 操作 系统 需要 提供 具有 文件 安全 特性 (就 像 Linux 操作 系 
统 中 所 见 到 的 那样 ) 的 复杂 文件 系统 ， 所 以 ， 在 第 18.5 节 便 就 NT 操作 系统 中 文件 的 组 织 和 
结构 以 及 文件 系统 元 数据 等 进行 了 解释 说 明 。 而 在 第 18.6 节 ， 则 就 NT 操作 系统 所 提供 的 
用 于 支持 相关 更 高 级 别 功能 的 基础 输入 /输出 功能 予以 阐述 。 

就 像 Mac 操作 系统 和 Linux 操作 系统 一 样 ，NT 操作 系统 图 形 化 用 户 界面 也 支持 多 个 重 
到 的 窗口 ， 故 而 需要 一 套 精心 设计 的 服务 于 图 形 化 用 户 界面 的 应 用 编程 接口 。 所 以 ， 在 第 
18.7 节 中 讨论 了 利用 NT 操作 系统 进行 图 形 化 用 户 接口 程序 设计 的 一 些 要 领 。 运 行 Palm 等 
操作 系统 的 掌上 电脑 往往 拥有 精巧 的 通信 选项 ， 但 在 大 多 数 情况 下 ， 它 们 每 次 只 会 使 用 一 
个 。 相 比 之 下 ,在 NT 操作 系统 中 ， 用 户 可 能 会 同时 开展 许多 通信 活动 ， 壁 如 查收 电子 邮 
件 、 通 过 互联 网 玩 游戏 、 与 掌上 电脑 进行 数据 库 的 同步 ， 等 等 。 为 此 ， 在 第 18.8 节 中 ， 主 
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要 就 Windows NT 操作 系统 中 的 各 种 网 络 支持 进行 了 讨论 。 另 外 ，NT 操作 系统 常常 运行 在 
具有 多 个 处 理 器 的 系统 上 ， 特 别 是 当 其 主要 用 作 服 务 器 而 不 再 仅仅 是 作为 工作 站 的 情况 下 。 
故而 在 第 18.9 节 就 NT 操作 系统 对 此 类 系统 的 支持 方式 进行 了 介绍 。 在 第 18.10 节 中 ， 我们 
还 就 XP 发 行 版 本 的 NT 操作 系统 的 启动 速度 提升 的 目的 以 及 相关 速度 提升 为 什么 重要 的 原 
因 了 予以 概述 。 最 后 ， 我 们 在 第 18.11 节 中 对 整 章 内 容 进 行 了 归纳 总 结 。 


18.1 Windows NT 系列 操作 系统 发 展 历程 


最 初 的 某 些 发 展 历程 : 如 前 所 述 ，Windows 操作 系统 起 初 是 为 支持 单个 用 户 使 用 个 人 计 
算 机 而 开发 的 。 有 关 支 持 可 以 追溯 到 8088/8086 处 理 器 时 代 。 微 软 在 1981 年 开始 研发 支持 
图 形 化 用 户 界面 ( Graphical User Interface，GUI， 又 称 为 图 形 化 用 户 接口 ) 的 操作 系统 。 当 
时 ， 相 应 的 操作 系统 被 称 为 界面 管理 器 ( Interface Manager，IM)。 期 间 所 使 用 的 处 理 器 在 
保护 一 个 进程 免 受 其 他 进程 的 影响 方面 缺乏 必要 的 功能 支持 。 由 于 这 类 硬件 限制 问题 ， 在 此 
之 前 的 大 多 数 个 人 计算 机 操作 系统 均 非 多 处 理 系统 ， 而 且 也 不 是 界面 管理 器 。 尽 管 可 以 同时 
打开 多 个 应 用 程序 ,但 实际 上 只 会 有 一 个 程序 处 于 运行 状态 。 当时 的 窗口 不 能 重 肆 ， 而 只 能 
按 平 铺 方式 进行 处 理 。 平 铺 的 窗口 甚至 连 部 分 地 覆盖 和 披 此 的 情况 都 不 会 出 现 ， 因 此 对 于 操作 
系统 来 说 ， 窗 口 管理 非常 简单 。 到 了 1983 年 正式 发 布 界面 管理 器 的 时 候 ， 相 应 操作 系统 的 
名 称 调整 为 了 Windows。 就 像 技术 开发 领域 经 常 发 生 的 那样 ， 图 形 化 用 户 界 面 的 思想 在 好 
多 机 构 同 时 得 到 了 推进 和 发 展 。 有 关 想 法 萌芽 于 施乐 由 洛 阿尔 托 研 究 中 心 (Xerox Palo Alto 
Research Center，PARC)， 故 而 Windows 并 非 面向 英特尔 系列 处 理 器 的 第 一 个 使 用 图 形 化 用 
户 界面 的 操作 系统 。 在 Windows 发 布 之 前 ， 个 人 软件 公司 (Personal Software， 后 来 改名 为 
VisiCorp) 就 曾 发 布 了 VisiOn， 该 系统 实际 上 是 以 类 似 于 UNIX 操作 系统 中 的 X-Windows 
的 方式 而 运行 在 操作 系统 之 上 的 一 种 支撑 环境 。IBM 也 曾 着 手 开展 所 谓 TopView 的 多 处 理 
8x86 环境 的 研发 ， 不 过 该 系统 并 不 包含 图 形 化 用 户 界 面 。 

第 一 版 的 Windows 操作 系统 只 能 算得 上 勉强 成 功 ， 这 主要 是 因为 硬件 体系 结构 的 限制 
和 处 理 器 的 速度 。 以 后 的 版 本 则 利用 了 80286 处 理 器 中 的 更 先进 的 功能 ， 从 而 为 内 存 管理 
提供 了 更 好 的 支持 ， 但 是 在 图 形 显示 方面 ， 这 一 时 期 的 个 人 计算 机 的 性 能 仍然 显得 有 点 力 
不 从 心 。 此 外 ， 这 些 版 本 的 Windows 系统 实际 上 是 运行 在 原先 的 16 位 DOS 操作 系统 上 的 
外 这 。 而 且 ， 它们 大 部 分 代码 甚至 完 完 全 全 都 是 用 汇编 语言 编写 的 ， 故 而 越 来 越 难以 增强 ， 
甚至 后 来 连 维护 都 很 困难 了 。 在 80386 处 理 器 上 市 的 时 候 ， 微 软 发 布 了 一 版 称 为 Windows 
3.0 的 操作 系统 ， 并 取得 了 极 大 的 成 功 。 尽 管 如 此 ， 由 于 这 时 的 Windows 系统 还 是 建立 在 
DOS 操作 系统 之 上 ， 所 以 仍然 存在 大 量 的 问题 。 这 一 产品 拥有 各 种 各 样 的 迭代 版 本 ， 包 括 
Windows 3.1 和 Windows for Workgroups (面向 工作 组 的 Windows 操作 系统 )。 另 外 ， 当 时 
的 Windows 操作 系统 还 存在 硬件 的 指令 集 和 寻 址 空间 仅 允 许 按照 16 位 内 存 寻 址 空间 的 方 
式 来 进行 设计 等 限制 或 缺点 。 再 后 来 ，32 位 指令 集 和 内 存 模型 的 使 用 等 实质 性 提高 完善 方 
案 陆 陆续 续 地 融入 了 改进 版 的 Windows 系列 操作 系统 中 ， 有 具体 包括 Windows 95、Windows 
98、Windows 98 SE (第 二 版 的 Windows 98 ) 和 Windows ME ( Millennium Edition， 即 千 禧 
版 Windows 操作 系统 ) 等 。 

在 开发 早期 版 本 的 Windows 系统 的 同时 ， 微 软 还 参与 开发 了 一 个 与 IJBM 公司 的 OS/2 
相 类 似 的 操作 系统 。 起 初 ，OS/2 被 看 作 是 同时 运行 多 个 基于 文本 的 程序 的 一 种 手段 。 随 后 ， 
拥有 图 形 化 用 户 界 面 并 运行 在 80286 和 80386 处 理 器 上 的 其 他 版 本 的 OS/2 也 陆续 发 布 和 发 
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行 。 在 某 种 意义 上 ， 他 们 认定 用 汇编 语言 编写 操作 系统 (就 像 DOS 一 样 ) 并 不 是 一 个 很 好 
的 主意 ， 所 以 0S/2 的 大 部 分 代码 是 用 C 语言 编写 的 。 起 初 ，OS/2 所 拥有 的 应 用 程序 接口 其 
实 就 是 DOS 系统 的 应 用 程序 接口 的 扩展 。 第 三 版 的 OS/2 由 微软 发 起 ， 并 采用 OS/2 自身 原 
生 的 应 用 程序 接口 对 整个 操作 系统 进行 了 彻 彻底 底 的 重 写 。 然 而 ，Windows 3.x 的 巨大 成 功 
导致 微软 重新 评估 其 最 初 的 研发 方向 。 于 是 ， 这 一 原生 和 自主 设计 的 应 用 程序 接口 被 进一步 
改造 成 面向 Windows 95 及 更 高 版 本 而 开发 的 32 位 Win32 接口 。 从 某 种 程度 说 ， 这 种 变化 
的 结局 就 是 ，IBM 公司 和 微软 在 OS/2 的 研发 合作 方面 分 道 扬 镰 。IBM 公司 自己 留 下 来 继续 
开发 OS/2， 而 微软 则 把 有 关 发 行 版 的 名 称 改 成 了 NT。 

除了 Win32 应 用 程序 接口 ，NT 也 拟定 要 支持 面向 DOS 系统 和 Windows 3.x 系统 而 开 
发 的 16 位 应 用 程序 。 此 外 ， 许 多 美国 政府 和 公司 采购 都 要 求 UNIX 风格 的 应 用 程序 接口 。 
因此 ，NT 还 包括 对 按照 UNIX 系统 标准 化 的 POSIX.1 API 所 编写 的 应 用 程序 的 支持 。( 尽 管 
POSIX 接口 实际 上 是 独立 于 特定 操作 系统 的 ， 但 是 其 得 到 了 各 个 分 散 的 UNIX 社区 的 推动 ， 
并 在 很 大 程度 上 依赖 于 相应 的 应 用 程序 接口 。) 

在 当时 ， 英 特 尔 x86 处 理 器 (Intel x86 ) 尚未 在 个 人 计算 机 领域 取得 目前 这 种 主导 支配 
地 位 。 如 果 有 哪 家 公司 的 处 理 器 主导 了 个 人 计算 机 市 场 ， 那 么 微软 便 需 要 确保 他 们 的 操作 
系统 能 够 运行 在 对 应 的 处 理 器 平台 上 。 但 如 果 没 有 哪 家 处 理 器 占据 主导 地 位 ， 那 么 他 们 的 
操作 系统 就 需要 运行 在 大 多 数 的 处 理 器 甚至 是 所 有 的 处 理 器 平台 上 。 因 此 ， 他 们 把 可 移植 性 
( portability) 确定 为 是 其 主要 操作 系统 产品 的 首要 目标 。 这 意味 着 他 们 不 得 不 抛弃 基于 DOS 
操作 系统 的 Windows 产品 ， 而 去 编写 一 种 新 的 操作 系统 。 为 了 确保 可 移植 性 ， 他 们 决定 采 
用 高 级 语言 来 编写 这 种 新 的 操作 系统 。 毋 庸 置疑 ， 采 用 高 级 语言 还 有 许多 其 他 的 理由 。 为 了 
构建 这 种 新 的 操作 系统 ， 他 们 聘请 了 一 群 经 验 丰 富 的 操作 系统 设计 人 员 。 他 们 原先 打算 采用 
C++ 语言 来 编写 操作 系统 ， 且 最 初 把 英特尔 i860 处 理 器 等 作为 目标 运行 平台 。 英 特 尔 i860 
处 理 器 是 一 款 精 简 指 令 集 计算 机 (Reduced Instruction Set Computer，RISC) 处 理 器 。 有 关 
团队 所 使 用 的 那 款 处 理 器 芯片 称 为 N10， 且 微软 使 用 的 是 所 谓 N10 (N-Ten) 的 i1860 仿真 器 。 
这 就 导致 了 NT 名 称 的 诞生 ， 同 时 也 寓意 新 技术 (New Technology)。 需 要 说 明 的 是 ， 有 关 
硬件 后 来 被 证 实在 支持 面向 对 象 编程 (object-oriented programming) 方面 颇 显 乏力 ， 所 以 
NT 操作 系统 的 内 核 最 后 几乎 完全 是 采用 标准 C 语言 编写 的 。 

各 种 各 样 的 Windows 产品 和 微软 的 早期 系统 之 间 的 最 大 区 别 体 现在 图 形 化 用 户 界面 上 。 
显然 , 今天 的 图 形 化 用 户 界 面 非常 普遍 一 一 这 可 能 需要 稍 加 解释 一 下 ， 毕 竟 当 Windows 操 
作 系 统 刚 刚 创建 时 ， 图 形 化 用 户 界面 对 微软 的 操作 系统 而 言 尚 算是 新 鲜 玩 意 。 此 类 界面 极 大 
地 增强 了 用 户 体 验 ， 扩 展 了 用 户 与 系统 交互 的 方式 ， 可 以 说 是 远 远 超 越 了 面向 文本 的 终端 提 
供 的 相关 方式 ， 并 且 还 增加 了 一 次 运行 多 个 任务 的 能 力 。 多 个 程序 运行 在 单独 但 可 能 重 释 的 
基于 图 形 的 任务 窗口 中 ， 同 时 通过 诸如 鼠标 或 触摸 板 (touch pad) 等 指针 式 设备 ( pointing 
device) 在 屏幕 上 移动 一 个 指示 器 来 加 以 控制 ， 这 种 结合 取得 了 巨大 的 成 功 。 今天， 除了 幅 
入 在 家 用 电器 和 其 他 机 器 中 的 系统 之 外 ， 很 少 有 操作 系统 不 包含 此 类 界面 。 需 要 强调 的 是 ， 
在 诸如 UNIX、Linux 和 Mac OS X 等 操作 系统 中 ， 图 形 化 用 户 界 面 是 位 于 操作 系统 顶部 的 
单独 的 一 层 。 但 在 微软 的 Windows 产品 中 ， 图 形 化 用 户 界面 则 是 操作 系统 设计 的 一 个 有 机 
的 组 成 部 分 ， 并 且 ， 自 从 至 少 是 Windows 2000 发 行 版 以 来 ， 图 形 化 用 户 界 面 一 直 是 内 核 的 
一 部 分 。 

早期 的 NT 操作 系统 的 工作 有 时 是 在 MIPS 架构 (Microprocessor without Interlocked 
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Piped Stage， 无 联 锁 管道 阶段 的 微 处 理 器 ) 的 系统 上 完成 的 。 后 来 ， 微 软 终于 下 定 决心 ,他 
们 希望 用 NT 系统 取代 所 有 现 有 的 DOS 系统 和 Windows 系统 ， 故 而 增加 了 针对 80x86 系列 
处 理 器 的 支持 ， 并 由 于 关系 到 一 般 的 操作 系统 使 用 的 芯片 问题 而 最 终 放 弃 了 i860 处 理 器 。 
另外 还 增加 了 对 其 他 处 理 器 的 支持 ， 包 括 DEC Alpha 64 位 处 理 器 、MIPS RISC 处 理 器 以 及 
PowerPC。( MIPS 芯片 用 于 多 个 机 器 系列 中 ， 包 括 硅谷 图 形 公司 工作 站 。) 然而 ， 市 场 最 终 
对 这 三 种 处 理 器 在 个 人 计算 机 中 的 使 用 投下 了 反对 票 ， 所 以 它们 在 后 来 的 NT 操作 系统 版 本 
中 不 再 给 予 支持 。 与 此 同时 ， 在 XP 版 的 NT 操作 系统 中 ， 又 增加 了 对 英特尔 安 腾 64 位 精 
简 指令 集 计 算 机 处 理 器 以 及 英特尔 公司 和 AMD 公司 的 64 位 x64 系列 处 理 器 的 支持 。 因 此 ， 
硬件 平台 独立 性 的 理念 一 直 是 NT 系列 操作 系统 的 一 项 重要 特征 。 

NT 系列 操作 系统 包括 Windows NT 3.1.3.5.3.51 和 4.0,Windows 2000( 内 核 版 本 NT 5.0 )， 
Windows XP (内 核 版 本 NT 5.1 )，Windows Server 2003，Windows XP x64 版 ， 以 及 现在 的 
Windows Vista (内 核 版 本 6.0 )。NT 操作 系统 产品 系列 包括 对 图 形 化 用 户 界 面 、 虚 拟 内 存 、 
日 志 式 文件 系统 (Journaling File System，JFS)、 抢 占 式 多 任务 (preemptive multitasking) 以 
及 一 整套 网 络 协议 的 支持 。 总 的 来 说 ，NT 系统 是 一 种 非常 高 端的 操作 系统 。 虽然 在 此 期 间 ， 
整个 产品 系列 进行 过 一 些 显著 的 增强 和 改良 ， 但 我 们 在 本 章 中 描述 的 系统 体系 结构 所 涉及 的 
大 部 分 内 容 自 从 NT 操作 系统 第 一 版 发 行 以 来 就 基本 上 没有 发 生 过 变化 。 


Windows Vista 


Windows Vista 是 最 新 版 的 NT 操作 系统 。 关 于 Vista， 微 软 的 主要 目标 是 提高 NT 操作 
系统 的 安全 性 ， 不 过 同时 也 在 许多 其 他 方面 进行 了 改进 和 增强 。 在 此 ， 我 们 简要 阐释 Vista 版 
操作 系统 的 一 些 功能 特征 ， 以 具体 说 明 当 前 操作 系统 研发 过 程 中 所 实施 的 各 种 举措 。 换 句 话 
说 ， 其 中 的 许多 功能 在 其 他 的 现代 操作 系统 中 也 可 以 找到 。Vista 系统 中 与 NTFS 完全 相关 的 
功能 特征 将 在 第 18.5.5 节 中 展开 讨论 。 与 安全 性 或 可 靠 性 密切 相关 的 几 项 新 的 功能 如 下 所 述 : 

e 代码 完整 性 验证 ( code integrity verification )。 目 前 ， 操 作 系统 加 载 程序 和 内 核 会 针 
对 所 有 的 内 核 模 式 的 二 进 制 代码 执行 加 载 时 的 检查 ， 以 验证 磁盘 上 的 有 关 模 块 没有 
发 生 过 更 改 。 这 将 有 助 于 防止 恶意 程序 ( malicious program) 通过 修改 操作 系统 来 控 
制 机 需 。 
服务 安全 提升 (service security improvement)。 现 在 ， 各 种 服务 可 以 明确 标定 它们 所 
需要 的 特权 (例如 ， 关 机、 审计 、 受 限 写 等 )， 从 而 约束 有 关 服 务 的 权限 。 未 予 明确 
省 定 的 特权 将 被 全 部 去 除 ， 故 而 限制 了 受 损 服务 可 能 对 操作 系统 所 造成 的 损害 。 

用 户 账户 控制 ( User Account Control，UAC )。 在 管理 员 授权 提升 特权 级 别 之 前 ， 应 
用 程序 均 被 限制 为 标准 用 户 权限 ， 通 过 这 样 的 用 户 账户 控制 策略 将 可 以 有 效 地 改进 
相关 安全 特性 。 进 一 步 说， 一 个 用 户 可 能 拥有 管理 员 权 限 ， 但 是 该 用 户 所 运行 的 应 
用 程序 通常 仅 具 有 标准 用 户 权限 ， 除 非 事先 得 到 批准 或 该 用 户 明 确 授 权 其 具有 较 高 
权限 。 用 户 账户 控制 功能 将 自动 提示 用 户 提 供 额 外 特权 ， 或 者 用 户 也 可 以 右 击 程序 
图 标 ， 然 后 选择 “以 管理 员 身 份 运行 "， 从 而 提升 特权 级 别 。 

地 址 空间 布局 随机 化 (Address Space Layout Randomization，ASLR)。 这 是 一 种 通 
过 对 进程 的 各 部 分 地 址 空间 进行 随机 分 配 从 而 改善 相关 安全 的 技术 。 地 址 空间 布局 
随机 化 技术 通常 会 牵涉 可 执行 程序 的 基 址 以 及 库 、 堆 空间 (heap space) 和 栈 空间 
( stack space)。 有 关机 制 将 会 通过 防止 攻击 者 对 其 所 设 定 的 攻击 目标 的 相关 组 件 地 址 
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的 预测 来 阻止 某 些 类 型 的 安全 攻击 。 

用 户 模 式 驱 动 程序 框架 (User-Mode Driver Framework，UMDF )。 大 多 数 驱动 程序 
都 运行 在 内 核 模式 下 ， 并 对 物理 地 址 空间 和 系统 数据 结构 拥有 完全 的 访问 权 。 此 类 
访问 有 可 能 使 恶意 驱动 程序 或 编码 存在 问题 的 驱动 程序 诱发 某 些 问题 ， 进 而 影响 到 
其 他 驱动 程序 或 系统 本 身 ， 并 最 终 造 成 整 台 机 器 的 骨 溃 。 相 比 之 下 ， 在 用 户 模式 下 
运行 的 驱动 程序 只 能 访问 用 户 地 址 空间 ， 存 在 的 风险 要 小 得 多 。Vista 新 增 了 对 这 种 
用 户 模式 驱动 程序 的 支持 。 用 户 模式 驱动 程序 框架 是 专 为 像 照 相机 和 便携 式 音乐 播 
放 器 等 设备 而 设计 的 。 


其 他 一 些 与 可 靠 性 有 关 的 新 型 功能 还 包括 : 


Windows 错误 报告 机 制 。 这 项 功能 用 于 捕获 源 自 于 终端 用 户 那里 的 应 用 软件 裔 溃 或 
挂 起 等 相关 的 数据 (在 征 得 有 关 用 户 同 意 报告 的 前 提 条 件 下 )。 软 件 开发 人 员 可 以 在 
线 访 问 与 其 应 用 程序 相关 的 数据 ， 监 控 错 误 趋 势 ， 并 下 载 相 关 调 试 信息 。 

可 靠 的 睡眠 状态 。 在 以 往 ， 应 用 程序 或 驱动 程序 可 能 会 阻止 系统 进入 睡眠 或 休眠 模 
式 (hibernate mode， 是 一 种 睡眠 状态 )。 由 此 带 来 的 问题 是 ， 笔 记 本 电脑 用 户 常常 不 
会 意识 到 自己 的 系统 没有 进入 睡眠 状态 ， 故 而 最 终 会 导致 放 在 包 里 的 笔记 本 电脑 变 
得 过 热 、 电 池 耗 尽 而 数据 丢失 的 后 果 。 相 比 之 前 ，Vista 系统 在 进入 睡眠 状态 之 前 不 
会 询问 进程 ， 并 且 把 用 户 模式 下 的 超时 通知 从 20 秒 减少 到 了 2 秒 。 
清理 服务 后 再 关机 。 在 Vista 之 前 的 NT 系统， 有 关 服 务 是 没有 办 法 延迟 关机 时 间 
的 。 换 句 话 说， 在 事先 确定 的 超时 期 限 到 达 的 情况 下 ， 尽 管 相关 服务 还 在 继续 运行 ， 
但 整个 系统 也 会 立即 关机 。 因 此 ， 对 于 那些 需要 把 数据 刷新 存放 到 磁盘 的 服务 来 说 ， 
这 便 可 能 导致 某 些 后 果 。 利 用 Vista 系统 ， 如 果 有 服务 请 求 挂 起 关机 操作 ， 那 么 该 
服务 便 可 以 根据 需要 来 延迟 关机 时 间 。 实 际 上 ， 在 关机 时 ， 首 先 会 由 通知 型 服务 向 
所 有 处 于 运行 状态 的 服务 发 出 通知 ， 然 后 系统 将 等 待 这 些 服 务 停止 工作 。 在 此 期 间 ， 
有 需要 的 服务 便 可 以 请 求 挂 起 关机 操作 。 当 有 关 服 务 全 部 停 下 来 后 ， 系 统 才 会 继续 
正常 的 关机 操作 。 

服务 关闭 排序 机 制 。Vista 系统 支持 针对 服务 指定 一 种 关闭 次 序 ， 即 服务 关闭 时 需要 
遵循 的 相关 服务 间 的 依存 关系 。 


此 外 ，Vista 系统 还 新 增 了 一 些 功能 ， 主 要 是 着 眼 于 改善 总 体 性 能 和 缩减 关机 或 重启 系 
统 所 需 的 时 间 : 


延迟 式 自 动 启 动 服务 。 在 NT 系统 中 运行 的 服务 通常 被 设置 为 自动 启动 类 型 ， 因 为 
稍 后 可 能 就 会 需要 这 些 服务 。 然 而 ， 相 关 服 务 一 直 在 不 断 增 多 故而 使 得 系统 启动 所 
耗费 的 时 间 也 在 持续 延长 。 但 是 ， 许 多 自动 启动 类 型 的 服务 不 一 定 非得 在 系统 启动 
时 就 立即 启动 ， 它 们 仅仅 需要 的 是 一 种 无 人 参与 的 启动 方式 ， 所 以 在 系统 启动 后 ， 
这 些 服务 再 启动 准备 就 绪 也 完全 可 以 。 为 此 ，Vista 提供 了 一 种 称 为 延迟 式 自 动 启 动 
的 新 的 选项 。 被 指定 为 延迟 式 自动 启动 的 服务 将 会 在 系统 启动 后 不 久 再 予以 启动 ， 
从 而 加 快 了 系统 启动 过 程 ， 并 改善 了 用 户 登 录 体 验 。 

超级 预 提 取 机 制 (SuperFetch) 通过 分 析 经 常 使 用 的 应 用 程序 ， 并 试图 把 那些 常常 访 
问 的 应 用 程序 保持 在 主 存 中 ， 从 而 使 它们 能 够 更 加 快速 地 启动 执行 。 该 机 制 还 将 关 
注 什 么 时 候 相 关 预 取 的 数据 会 被 移出 到 页 面 文件 (page file)， 并 且 将 会 对 导致 预 取 数 
据 移出 到 页 面 文件 的 应 用 程序 实时 监控 。 一 旦 有 关 应 用 程序 执行 完成 ， 超 级 预 提取 
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机 制 将 会 把 对 应 预 提取 的 数据 再 次 拖 回 到 内 存 。 而 当 用 户 再 次 访问 相关 的 应 用 程序 
时 ， 其 所 需要 的 预 提取 的 数据 就 已 被 再 次 存放 在 了 主 存 中 。 

闪 速 缓存 机 制 (ReadyBoost) 用 于 在 闪存 设备 上 创建 缓存 内 存 。 尽 管内 存 设备 的 数据 
传输 速度 要 低 于 当前 的 硬盘 驱动 器 ， 但 是 闪存 设备 既 没有 寻 道 时 间 开 销 ， 也 没有 旋 
转 延 迟 时 间 开 销 ， 因 此 它们 可 以 大 幅度 提高 硬盘 的 表 观 速度 ( apparent speed)。 请 注 
意 ， 这 与 我 们 在 第 14 章 关 于 将 来 替代 旋转 式 存储 器 的 预测 是 一 致 的 。 

闪 速 驱动 器 (ReadyDrive) 机 制 用 于 支持 有 关 的 混合 硬盘 驱动 器 。(hybrid hard drive) 
作为 一 种 新 型 驱动 器 ， 混 合 硬盘 包含 有 大 容量 的 闪存 缓冲 区 。 当 数据 在 主 存 和 硬盘 
驱动 器 中 的 闪存 内 存 (flash RAM) 之 间 进 行 迁移 的 时 候 ， 驱 动 器 在 大 部 分 时 间 可 以 
处 于 断 电 状 态 ， 所 以 这 种 硬盘 可 以 显著 降低 驱动 器 的 功 耗 。 与 此 同时 ， 鉴 于 相关 部 
件 的 移动 操作 大 量 减 少 ， 所 以 此 类 驱动 器 的 可 靠 性 得 到 了 增强 。 另 外 ， 由 于 从 闪存 
上 读 取 数据 要 比 首先 等 待 盘 片 旋转 然后 查找 数据 的 过 程 快 出 许多 ， 所 以 整个 系统 将 
会 拥有 更 快捷 的 启动 速度 。 


18.2 用户 操作 系统 环境 


因为 NT 系统 环境 从 根本 上 来 说 就 是 图 形 化 用 户 界面 ， 所 以 用 户 可 以 轻松 地 在 屏幕 上 打 
开 许 多 窗口 并 启动 运行 多 个 应 用 程序 。 对 于 NT 用 户 来 说 ， 在 任何 时 候 让 十 几 个 甚至 更 多 的 
应 用 程序 运行 ， 这 也 是 稀 玻 平常 的 事情 。 一 般 而 言 ， 往 往 会 有 一 个 电子 邮件 阅读 器 在 不 时 地 
查收 所 传人 的 邮件 ;同时 一 个 约会 日 程 安排 程序 也 已 打开 ;而 网 络 浏览 器 ， 则 可 能 打开 了 一 
个 门户 页 面 ， 上 面 正 “播报 ”着 最 新 新 闻 ， 并 不 断 刷 新 相应 用 户 股 票 投资 组 合 的 统计 数据 ; 
用 户 呢 ， 正 在 电子 制 表 软件 或 者 其 他 的 办 公 类 型 的 应 用 程序 上 工作 ; 有 一 个 窗口 则 显示 着 用 
户 刚刚 查找 过 单词 的 电子 词典 ; 另外 还 有 一 个 即时 通信 (instant messenger) 应 用 程序 也 在 运 
行 中 。 这 些 还 没有 包括 可 能 正在 运行 的 许 许多 多 的 其 他 的 实用 程序 ， 例 如 本 地 防火 墙 、 剪 贴 
板 编辑 器 、 电 池 状 态 指示 器 、 音 量 调节 面板 等 等 。 与 此 同时 ， 还 可 能 运行 着 像 共 享 打 印 、 个 
人 网 页 服务 等 服务 器 功能 。 因 此 ， 尽 管 NT 操作 系统 被 许多 用 户 看 作 是 单 用 户 系 统 ， 但 这 绝 
不 意味 着 该 操作 系统 仅仅 只 有 少数 几 样 东西 正在 运行 中 。 


目标 : 跨 多 硬件 平台 及 操作 系统 平台 模拟 


跨越 多 种 硬件 平台 的 可 移植 性 以 及 对 来 自传 统 操作 系统 的 应 用 程序 的 支持 是 NT 操作 系 
统 开发 人 员 的 两 项 主要 目标 。 为 了 实现 第 一 项 目标 ， 微 软 运用 了 两 种 方法 。 首 先 ， 在 很 大 程 
度 上 ， 操 作 系统 内 核 的 某 些 低级 的 硬件 相关 的 部 分 被 分 离 出 来 并 被 组 织 放置 在 上 所谓 硬件 抽象 
层 ( Hardware Abstraction Layer，HAL ) 的 单一 模块 中 。 当 然 ， 其 他 模块 也 会 拥有 部 分 代码 
对 硬件 存在 依赖 关系 ， 例 如 ， 内 存 管理 模块 必须 得 知道 物理 内 存 的 页 面 大 小 。 但 是 ， 通 过硬 
件 抽象 层 的 建立 及 部 分 地 把 操作 系统 中 依赖 于 硬件 的 代码 隔离 在 单个 模块 中 ， 便 使 得 将 整个 
系统 移植 到 新 的 硬件 平台 的 过 程 大 大 简化 了 。 需 要 说 明 的 是 ， 硬 件 抽象 层 往往 随 着 与 处 理 器 
一 起 使 用 的 支持 芯片 〈 例 如 ， 中 断 控制 器 )、 系 统 是 单 处理 器 还 是 多 处 理 器 系统 以 及 基本 输 
和 /输出 系统 支持 的 是 什么 样 的 电源 管理 特性 等 因素 而 发 生 改 变 。 同 时 ， 有 关 芯 片 把 总 线 和 
其 他 设备 连接 到 处 理 器 上 ， 故 而 有 时 也 会 规定 某 些 特定 的 指令 ， 就 像 处 理 器 一 样 。 第 二 种 技 
术 就 是 采用 与 机 器 无 关 的 更 高 级 的 语言 来 编写 操作 系统 的 所 有 其 余部 分 。 最 初 选 定 的 语言 是 
C++， 其 初衷 是 让 整个 系统 成 为 彻 彻底 底 的 面向 对 象 的 系统 。 然 而 后 来 ， 这 一 策略 进行 了 调 
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整 ， 相 关 限 制 采取 了 宽松 处 理 ， 进 而 出 于 效率 的 考量 ， 大 量 的 NT 代码 都 利用 C 语言 进行 了 
编写 。NT 操作 系统 无 须 进 行 重大 的 改写 就 能 够 支持 若干 不 同 的 处 理 器 的 事实 表明 ， 其 在 这 
方面 的 目标 已 得 到 非常 成 功 的 落实 。 
至 于 第 二 项 目标 ， 即 正确 高 效 地 运行 传统 应 用 程序 ， 也 已 基本 实现 。 由 于 NT 操作 
421] 系统 强力 实施 只 有 操作 系统 才 被 允许 直接 控制 硬件 的 限制 ， 所 以 有 许多 DOS 系统 和 少数 
Windows 3.x 系统 的 应 用 程序 因 直 接 使 用 了 硬件 而 将 无 法 在 NT 环境 中 运行 。 大 多 数 的 没有 
直接 操作 硬件 的 应 用 程序 将 会 在 NT 环境 中 正常 运行 。 支 持 传统 应 用 程序 的 关键 设想 是 在 内 
核 之 上 另外 增加 一 层 ， 且 这 一 层 通过 把 传统 的 应 用 程序 接口 调用 转换 为 原生 的 NT 操作 系统 
的 应 用 程序 接口 调用 来 实现 对 传统 的 应 用 程序 接口 调用 的 支持 。 在 NT 系列 操作 系统 中 ， 这 
些 额 外 的 层次 被 称 为 “环境 ”(environment) 或 “ 子 系统 ”(subsystem)。 事 实 上 ， 即 使 被 认为 
是 NT 系列 操作 系统 标准 的 32 位 Windows 应 用 程序 接口 也 不 是 NT 系统 内 核 自身 原生 的 应 
用 程序 接口 。 相 关子 系统 如 图 18-1 所 示 。 到 XP 操作 系统 发 布 时 为 止 ， 全 世界 的 计算 机 系 
统 基本 上 已 抛弃 了 OS/2 操作 系统 ， 故 而 XP 版 的 NT 操作 系统 就 停止 了 对 OS/2 子 系统 的 支 
持 。 另 外 ， 起 初 NT 操作 系统 所 包含 的 POSIX 支持 仅仅 是 IEEE 1003.1/1SO 9945-1 标准 的 
最 小 限度 的 实现 ， 其 在 XP 版 操作 系统 中 先是 被 撤销 ， 随 后 被 更 完整 的 实现 方案 所 取代 。 
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图 18-1 最 初 的 Windows NT 系列 操作 系统 体系 结构 


可 以 肯定 的 是 ，NT 系列 操作 系统 起 初 还 有 许多 其 他 的 设计 目标 ， 壁 如 性 能 、 可 靠 性 以 及 
关于 构建 一 流 操 作 系 统 的 高 级 目标 ， 这 与 受到 有 限 资源 蜂 绊 的 早期 版 本 的 Windows 操作 系统 
存在 很 大 的 不 同 。 但 是 ， 可 移植 性 和 兼容 性 的 目标 则 可 能 是 对 整个 系统 设计 影响 最 大 的 目标 。 

有 关子 系统 并 不 都 是 简单 和 直接 的 ， 运 行 以 前 的 应 用 程序 有 时 会 导致 很 多 问题 。 例 如 ， 
DOS 操作 系统 是 单 用 户 系统 ， 因 此 应 用 程序 通常 会 启动 输入 /输出 操作 ， 然 后 就 执行 自 旋 锁 

[422| 以 等 待 相应 操作 完成 。 而 NT 操作 系统 对 处 理 器 进行 了 虚拟 化 处 理 ， 所 以 其 他 的 应 用 程序 不 
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会 被 锁定 ， 但 是 在 此 期 间 DOS 应 用 程序 可 能 消耗 掉 大 量 的 处 理 吕 周期。 类似 地 ， 上 默认 情况 
下 ， 所 有 16 位 的 Windows 应 用 程序 是 以 在 Windows 操作 系统 的 虚拟 DOS 计算 机 上 的 窗口 
( Windows on Windows Virtual DOS Machine， WOW VDM) 中 的 线程 方式 来 运行 的 。 按 照 线程 的 
调度 方式 ， 如 果 有 一 个 Windows 应 用 程序 停止 接收 输入 ,那么 所 有 那些 应 用 程序 都 将 被 挂 起 。 


18.3 ”进程 调度 


NT 操作 系统 使 用 一 种 复杂 的 机 制 来 控制 和 调度 当前 正在 运行 的 进程 。 进 一 步 说 ， 该 系 
统 往往 会 启动 运行 多 个 进程 ， 并 为 每 个 进程 创建 至 少 一 个 线程 。 在 此 基础 上 ， 它 将 会 调度 
有 关 线 程 而 不 是 进程 来 加 以 执行 ， 而 且 其 间 所 使 用 的 是 多 级 反馈 队列 (multilevel feedback 
queue) 机 制 。NT 系统 中 的 每 个 线程 均 会 拥有 一 个 取 值 在 0 一 31 之 间 的 优先 级 ， 以 告知 操作 
系统 相应 进程 在 尽快 被 调度 运行 方面 的 重要 程度 。 线 程 优先 级 根据 对 应 进程 的 基本 优先 级 
(base priority， 将 会 在 下 面 给 出 定义 ) 派生 形成 。 对 于 这 32 种 优先 级 中 的 每 一 个 优先 级 别 ， 
都 会 存在 一 个 单独 的 队列 来 组 织 那 些 已 为 运行 准备 就 绪 的 线程 。 当 一 个 线程 启动 运行 时 ， 其 
被 赋予 一 个 限定 的 时 间 量 (time quantum ， 或 称 为 时 间 片 ， 即 time slice) 来 加 以 执行 。 当 对 
应 时 间 期 限 到 达 时 ， 该 线程 将 会 被 挂 起 ， 并 被 放置 在 其 优先 级 对 应 的 运行 队列 的 末尾 ， 同 时 
该 优先 级 的 下 一 个 线程 将 会 被 启动 运行 。 对 于 每 个 优先 级 别 而 言 ， 只 有 当 在 该 优先 级 别 上 
为 运行 准备 就 绪 的 所 有 线程 都 已 执行 完 后 ， 调 度 器 才 会 移 到 下 一 个 较 低 优先 级 的 队列 上 进行 
调度 。 如 果 一 个 线程 正在 等 待 的 某 个 事件 〈 例 如 等 待 磁盘 读 取 一 些 数据 ) 已 经 完成 和 发 来 信 
号 ,那么 操作 系统 将 会 检查 等 待 对 应 事件 的 线程 是 否 拥 有 上 比 当 前 正在 运行 的 线程 更 高 的 优先 
级 。 如 果 是 ， 那 么 当前 线程 将 会 被 挂 起 ， 并 且 该 较 高 优先 级 的 等 待 线程 将 会 被 启动 运行 。 正 
如 在 第 8 章 所 论述 的 那样 ， 因 时 间 片 用 完 和 因 高 优先 级 事件 而 被 中 断 的 线程 都 是 抢占 式 多 任 
务 (preemptive multitasking) 的 例子 。 

当 一 个 进程 启动 时 ， 应 当 为 该 进程 确定 一 个 初始 的 基本 优先 级 类 别 (base priority class)， 
如 图 18-2 所 示 。 该 类 别 用 于 确定 相应 进程 中 的 所 有 线程 的 基本 优先 级 。 而 当 进 程 中 的 有 关 
线程 执行 的 时 候 ， 它 们 的 优先 级 可 能 会 根据 它们 执行 的 操作 而 发 生 改 变 ， 这 被 称 为 动态 优先 
级 (dynamic priority ) 。 线 程 优先 级 的 降低 或 提升 是 有 一 定 限度 的 ， 也 就 是 说 ， 不 能 降 到 某 
一 优先 级 别 之 下 ， 也 不 能 升 到 某 一 优先 级 别 之 上 。 伴 随 线程 运行 时 的 优先 级 的 这 种 改变 就 是 
相关 机 制 名 称 “ 多 级 反馈 队列 ”中 所 指 的 “反馈 ”的 内 涵 所 在 。 而 这 样 的 提升 和 降低 优先 级 
的 目的 则 在 于 ， 赋 予 那些 密集 聚焦 在 用 户 界面 上 的 交互 式 进程 以 更 高 的 优先 级 ， 同 时 适当 降 
低 那些 后 台 的 看 起 来 较 少 介入 用 户 界 面 的 进程 的 优先 级 。 

因此 ， 对 于 诸如 键盘 输入 之 类 的 交互 式 任务 所 涉及 的 线程 来 说 ，NT 调度 器 赋予 了 它们 
较 高 的 优先 级 。 为 了 做 到 一 点 ，NT 调度 器 使 用 了 一 种 与 第 8 章 中 所 论述 内 容 略 有 区 别 的 机 
制 。 如 下 为 NT 系统 提升 线程 优先 级 的 几 种 情况 : 

。 当 一 个 线程 执行 了 阻塞 式 调用 并 且 相 应 请 求 已 经 完成 时 ， 该 线程 的 动态 优先 级 应 当 

被 提升 ， 以 便 它 可 以 充分 利用 对 应 已 经 完成 的 操作 。 

e 当 与 普通 (NORMAL) 优先 级 上 的 一 个 进程 相关 联 的 窗口 获得 焦点 时 ,调度 器 应 当 
提升 对 应 进程 的 优先 级 使 其 大 于 或 等 于 所 有 后 台 进 程 的 优先 级 。 而 当 与 该 进程 关 
联 的 窗口 不 再 拥有 焦点 时 ， 相 应 的 优先 级 类 别 应 当 恢 复 为 其 先前 所 设置 的 级 别 。 

e 当 一 个 窗口 接收 到 诸如 鼠标 事件 、 定 时 器 事件 或 者 键盘 输入 之 类 的 输入 时 ， 调 度 器 
应 当 提升 拥有 该 窗口 的 相应 线程 的 动态 优先 级 。 
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图 18-2 NT 系统 中 线程 优先 级 关系 


在 一 个 线程 的 动态 优先 级 被 提升 之 后 ， 每 当 该 线程 完成 一 个 时 间 片 ， 调 度 器 都 会 将 该 线 
程 的 优先 级 降低 一 级 ， 直到 对 应 线程 降 回 到 其 基本 优先 级 别 上 。 也 就 是 说 ， 线 程 的 动态 优先 
级 永远 不 会 低 于 其 基本 优先 级 。 

NT 系统 拥有 一 些 运行 的 线程 被 其 认为 是 “实时 ”性 质 的 线程 ， 其 中 包括 处 理 如 移动 鼠 
标 等 时 间 敏 感 设备 之 类 的 线程 。 所 有 的 从 16 一 31 之 间 的 优先 级 被 认为 是 实时 的 优先 级 。 一 
个 普通 的 由 用 户 创建 的 进程 所 运行 的 线程 往往 被 赋予 从 0 一 15 之 间 的 优先 级 。 大 多 数 的 实时 
线程 是 操作 系统 的 线程 ， 但 是 ， 用 户 进程 也 可 以 使 用 实时 线程 。NT 操作 系统 不 是 硬 实时 系 
统 ， 所 以 这 些 进 程 都 是 软 实 时 进程 。 也 就 是 说 ， 尽 管 NT 操作 系统 会 努力 确保 相关 线程 根据 
需要 经 常 运行 和 尽快 运行 ,但 是 该 系统 并 不 会 采取 任何 措施 来 保证 满足 任何 即时 性 标准 。 另 
外 ，NT 操作 系统 不 会 提升 实时 线程 的 优先 级 。 

当 没 有 其 他 线程 准备 好 要 运行 的 时 候 ，NT 系统 会 运行 一 个 称 为 空闲 线程 (idle thread) 
的 特殊 线程 。 如 果 得 到 了 电源 电路 的 支持 ， 这 个 线程 还 可 使 处 理 器 进入 运行 得 较为 缓慢 的 
低 功 耗 运行 状态 ， 随 后 ， 空 闲 线程 便 陷 人 一 种 紧密 型 循环 之 中 。 拥 有 这 种 特殊 线程 还 允许 
操作 系统 能 够 确定 究竟 有 多 少 系统 资源 正在 被 用 于 实际 的 工作 以 及 有 多 少 系统 资源 并 没有 
被 使 用 ， 后 者 往往 是 因为 系统 正在 等 待 某 事 发 生 一 一 可 能 是 等 待 用 户 就 运行 其 他 哪个 程序 做 
出 指示 。 当 正在 运行 诸如 BOINC 之 类 的 志愿 者 计算 软件 包 时 ， 空 闲 线程 将 会 被 相应 的 志愿 
者 应 用 程序 所 替代 。 关 于 志愿 者 计算 项 目的 相关 内 容 ， 前 面 在 第 7 章 曾经 讨论 过 ， 在 此 不 再 
著述 。 


18.4 ”内 存 管理 


NT 操作 系统 支持 如 第 11 章 所 述 的 请 求 调 页 ( demand paging， 或 称 为 请 求 分 页 ) 式 虚 
拟 内 存 ( virtual memory) 系统 。 当 处 理 器 运行 一 个 进程 时 ， 它 会 产生 逻辑 内 存 地 址 ( logical 
memory address)， 以 方便 内 存 硬 件 用 于 提取 或 存储 指令 和 数据 。 内 存 管理 部 件 ( Memory 
Management Unit，MMU) 相关 硬件 则 会 把 所 生成 的 每 一 个 这 样 的 地 址 转换 为 存储 器 系统 随 
后 用 来 访问 相应 信息 的 物理 地 址 (physical address)。 整 个 存储 器 被 划分 成 固定 大 小 的 一 系 
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列 页 面 。 页 面 大 小 由 相应 硬件 决定 ， 因 此 操作 系统 必须 基于 硬件 所 使 用 的 页 面 大 小 来 进行 工 
作 。 对 于 英特尔 x86 系列 来 说 ， 有 关 页 面 的 大 小 通常 为 4KB。 但 对 于 其 他 的 系统 而 言 ， 页 
面 大 小 可 能 会 有 所 不 同 。 鉴 于 NT 操作 系统 被 设计 为 是 与 平台 无 关 的 ， 所 以 它 不 必 依赖 于 这 
些 页 面 的 实际 大 小 。 同 时 ， 考 虑 到 NT 操作 系统 被 设计 成 是 能 够 运行 在 许多 硬件 平台 上 的 ， 
因此 它 必 须 按照 灵活 适应 页 面 大 小 的 方式 来 进行 编码 。 


18.4.1 地 址 空间 


在 NT 操作 系统 中 ， 逻 辑 地 址 空间 被 划分 为 两 部 分 ,一 部 分 用 于 操作 系统 ， 而 男 一 部 分 
则 用 于 用 户 应 用 程序 ， 如 图 18-3 所 示 。 从 图 示 来 看 ， 用 户 空间 和 内 核 空间 平均 分 配 了 整个 
地 址 空间 ( address space)， 但 是 ， 这 在 某 些 情况 下 有 可 能 被 推翻 。 例 如 ， 如 果 数 据 库 服务 器 
( database server) 等 应 用 程序 需要 一 个 非常 大 的 内 存 空间 ， 那 么 这 种 均 分 方案 就 会 被 调整 。 
边 辑 寻 址 空间 中 预 留 出 了 两 块 其 他 的 区 域 用 来 辅助 检测 错误 ， 它 们 分 别 被 称 为 警戒 区 和 空 指 
针 捕 获 器 。 如 果 一 个 程序 偶然 引用 了 这 两 片 空 间 中 的 任何 一 个 地 址 ， 那 么 有 关 硬 件 将 会 发 出 
信和 号 以 示 错 误 ， 并 且 相 应 程序 将 会 被 中 止 。( 这 种 机 制 是 由 通常 与 操作 系统 一 起 使 用 的 语言 
支持 所 采用 的 一 种 惯例 ， 而 且 事实 上 并 不 由 操作 系统 本 身 来 强制 执行 .) 别 忘 了 ， 这 一 地 址 
是 4GB 的 逻辑 地 址 空间 的 一 部 分 。 设 立 这 些 保留 块 的 目的 在 于 ， 当 有 关 地 址 被 意外 使 用 时 ， 
通过 相关 硬件 来 产生 中 断 。 这 意味 着 ， 并 没有 任何 物理 内 存 会 被 分 配给 这 些 地 址 ， 因 此 我 们 
不 会 为 了 这 些 功能 的 实现 而 浪费 任何 实际 的 内 存 。 


2 GB 内 核 地 址 空间 0x80000000—0xFFFFFFFF 
保留 一 一 警戒 区 [| 0x7FFF0000-0x7FFFFFFF 
2 GB 用 户 地 址 空间 0x00010000-0x7FFEFFFF 


保留 一 一 空 指针 捕获 器 [| 0x00000000-0x0000FFFF 
图 18-3” 缺 省 情况 下 Windows NT 系列 操作 系统 关于 x86 体系 结构 的 内 存 映 射 
在 与 英特尔 架构 兼容 的 新 型 处 理 器 中 有 一 项 特殊 的 硬件 特性 ， 支 持 内 核 为 其 自身 使 用 


4MB 大 小 的 页 面 ， 从 而 仅 需 保存 更 小 的 页 表 ( page table)， 并 且 有 关 页 表 中 仅仅 需要 少数 几 
个 表 项 来 指向 内 核 的 静态 部 分 以 及 可 能 被 分 页 的 内 核 部 分 的 一 些 其 他 的 页 面 。 


18.4.2 ”页面 映射 


在 英特尔 8x86 兼容 处 理 器 上 运行 的 NT 操作 系统 采用 两 级 页 表 结 构 和 特殊 硬件 来 进行 
这 种 页 面 映射 转换 ， 就 像 第 11 章 所 描述 的 那样 9。 图 18-4 与 第 11 章 中 的 图 示 相 类 似 ， 但 标 
以 了 在 NT 操作 系统 中 所 采用 的 特定 术语 。 其 间 所 用 到 的 这 两 张 表 分 别称 为 页 目录 表 〈page 
directory) 和 页 表 (page table)。 两 级 页 表 机 制 的 使 用 允许 逻辑 地 址 空间 可 以 非常 庞大 ， 同 


”其 他 的 硬件 平台 可 能 会 采用 更 为 复杂 的 设计 方案 。 英 特 尔 兼容 的 处 理 器 必须 是 至 少 80386 以 上 的 架构 。 
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时 也 变 得 非常 稀疏 ， 并 且 页 表 本 身 也 被 划分 成 为 一 系列 页 面 。 因 此 ， 如 果 在 逻辑 地 址 空间 的 
给 定 块 中 没有 产生 页 表 项 ， 那 么 就 不 应 创建 相应 的 页 表 。 换 句 话说， 页 表 中 的 有 关 表 项 应 当 
指向 物理 内 存 中 的 实际 页 框 。 





图 18-4 多 级 页 表 


18.4.3 分 页 共享 及 写 时 复制 
我 们 可 以 看 到 ， 有 关 设 计 人 员 竭 尽 全 力 地 在 操作 系统 和 运行 进程 之 间 以 及 各 进程 彼此 
之 间 建 立 隔离 机 制 。 然 而 ， 有 时 候 如 果 进 程 能 够 共享 访问 内 存 中 的 相同 位 置 ， 则 是 非常 有 利 
的 。 当 然 ， 在 相关 进程 有 目的 地 来 共享 页 面 时 ， 必 须要 非常 小 心地 来 使 用 此 项 技术 。 不 过 ， 
[9 有 时 候 操作 系统 也 可 能 会 在 有 关 进 程 没有 意识 到 的 情况 下 允许 进程 共享 页 面 。 一 个 简单 的 
例子 是 一 个 进程 执行 fork 系统 调用 的 情形 。 具 体 而 言 ， 有 关 进 程 请 求 操作 系统 创建 该 进程 
的 另 一 个 副本 ， 并 且 同 时 运行 原先 的 副本 和 新 的 副本 。 在 这 种 情况 下 ，NT 操作 系统 将 会 创 
建 第 二 个 进程 ， 但 不 会 创建 所 有 页 面 的 实际 副本 。 相 反 ， 它 将 会 创建 一 组 新 的 页 表 ， 并 将 相 
关 页 表 项 指向 完全 相同 的 物理 页 面 。 在 这 两 组 页 表 中 ， 相 关 页 面 均 被 标记 为 只 读 属性 。 接 下 
来 ， 如 果 其 中 一 个 进程 对 某 一 给 定 页 面 中 的 某 一 内 存 位 置 执行 了 写 和 操作， 那么 相应 处 理 器 
将 会 产生 一 个 中 断 ， 于 是 操作 系统 将 会 为 每 个 进程 生成 一 份 该 页 的 单独 副本 ， 同 时 去 除 只 i 
标志 。 这 项 技术 称 为 写 时 复制 ( copy on write， 或 称 为 写 时 拷贝 )， 曾 经 在 第 11 章 中 进行 过 
讨论 。 对 于 大 型 对 象 特别 是 永远 不 会 发 生 修改 的 共享 库 来 说 ， 写 时 复制 技术 将 会 节省 大 量 的 
时 间 开 销 和 内 存 空 间 。 


18.4.4 页 面 置换 


在 第 11 章 中 ,我 们 讨论 了 当 页 面 需要 被 加 载 到 内 存 但 却 没 有 空闲 页 框 可 用 时 所 出 现 的 
问题 。 在 这 种 情况 下 ， 必 须 得 选择 一 个 当前 在 用 的 页 面 来 加 以 置换 。 我 们 讨论 了 许多 用 来 选 
择 欲 淘汰 页 面 的 算法 ， 其 中 许多 算法 利用 了 硬件 功能 来 辅助 操作 系统 选择 要 替换 的 页 面 。 由 
于 NT 操作 系统 是 被 设计 为 相对 独立 于 硬件 的 ， 所 以 有 关 设 计 人 员 并 没有 选择 依赖 于 那些 供 
分 页 硬件 所 使 用 的 最 先进 的 功能 。 相 反 ， 他 们 采用 了 (相对) 简单 的 先进 先 出 置换 算法 〈 与 
时 钟 式 算法 存在 一 定 渊源 )。 进 一 步 说 ， 当 一 个 页 面 第 一 次 加 载 进 入 内 存 时 ， 应 当 为 对 应 页 
面 记录 一 个 时 间 戳 。 当 需要 淘汰 一 个 页 面 时 ， 将 会 搜索 页 表 ， 并 且 选 择 最 先进 入 内 存 的 页 面 
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并 将 其 蔡 换 掉 。 遗 憾 的 是 ， 相 应 页 面 有 时 会 被 证 实 是 一 个 经 常 需要 访问 的 页 面 。 但 是 ,一旦 
该 页 面 被 重新 加 载 ， 它 将 会 得 到 一 个 新 的 时 间 惟 ， 故 而 ,很 可 能 不 会 马上 被 再 次 选中 。 男 
外 ，NT 操作 系统 关于 淘汰 页 面 的 选择 范围 仅仅 限于 发 生 缺 页 的 进程 自身 的 页 面 ， 即 采用 局 
部 置换 ( local replacement) 策略 。 相 比 之 下 ，Linux 和 大 多 数 其 他 的 UNIX 衍生 版 操作 系统 
往往 采用 全 局 置换 ( global replacement) 策略 ， 即 从 内 存 中 的 所 有 页 面 范围 内 来 选择 要 淘汰 
的 页 面 。 


18.4.5 ” 预 取 配置 


NT 及 其 他 操作 系统 采用 了 一 种 精巧 的 优化 方案 来 提高 应 用 程序 的 加 载 速 度 。 如 前 所 述 ， 
当 一 道 程序 在 虚拟 存储 系统 中 启动 运行 时 ， 整 道 程序 并 不 是 一 下 子 全 部 加 载 到 内 存 的 。 相 
反 ， 当 进程 引用 了 其 尚未 加 载 的 逻辑 地 址 空间 的 某 一 部 分 时 ， 便 会 发 生 一 个 缺 页 故障 ， 然 后 
将 所 需要 的 页 面 加 载 到 物理 内 存 中 。 为 此 ， 当 加 载 一 个 大 的 程序 (譬如 网 络 浏览 器 ) 时 ， 伴 
随 用 于 各 种 数据 结构 的 初始 化 代码 的 运行 ， 该 程序 的 不 同 部 分 的 页 面 更 倾向 于 几乎 是 以 随机 
顺序 加 载 到 内 存 的 。 于 是 ， 当 提取 各 段 程序 代码 时 ， 会 发 生 相 当 多 的 磁盘 操作 和 磁头 移动 。 
通常 情况 下 ，NT 操作 系统 会 监控 一 道 程序 启动 执行 10 秒 内 所 产生 的 缺 页 故障 。 然 后 ， 在 系 
统 不 忙 的 时 候 ， 它 就 会 对 这 份 缺 页 故障 列表 进行 排序 ， 并 将 相关 结果 列表 保存 在 该 程序 的 缺 
页 故障 配置 文件 ( page fault profile) 中 。 当 以 后 再 次 运行 相应 程序 时 ， 操 作 系统 将 会 预先 读 
取 其 所 掌握 的 通常 在 前 10 秒 内 应 当 加 载 的 所 有 页 面 。 这 种 方案 可 以 极 大 地 减少 磁头 的 移动 
操作 以 及 旋转 延迟 和 较 大 盘 块 输入 /输出 等 待 所 带 来 的 时 间 开 销 ， 并 因此 会 导致 更 快捷 的 程 
序 启动 速度 。 


18.5 文件 支持 


在 过 去 20 年 左右 的 时 间 里 ,计算 设备 的 价格 迅速 下 降 。 同 时 ,磁盘 存储 器 的 容量 却 迅 
猛 增加 。 当 磁盘 容量 很 小 的 时 候 ， 文 件 系统 结构 应 当 按 照 与 小 容量 磁盘 相 匹 配 的 方案 来 加 以 
设计 。 为 此 ,早期 的 DOS 文件 系统 的 指针 被 限定 为 12 位 ， 因 为 这 足以 用 来 指向 当时 所 使 用 
的 软盘 驱动 器 上 的 任何 扇 区 ， 并 且 有 关 设 计 人 员 不 想 把 空间 “浪费 ”在 “ 较 大 ”的 指针 上 面 。 
然而 ， 伴 随 驱动 器 容量 的 增 大 ， 文 件 系 统 设 计 必 须 进 行 调整 以 支持 更 大 的 硬盘 驱动 器 。 同 
时 ， 作 为 将 现 有 个 人 计算 机 系统 升级 到 NT 系列 操作 系统 的 目标 的 一 部 分 ， 也 需要 为 用 户 可 
能 拥有 的 各 种 各 样 的 文件 系统 建立 一 条 迁移 途径 。 弓 庸 置疑 ， 大 多 数 的 操作 系统 都 有 自己 首 
选 的 文件 系统 。NT 操作 系统 也 不 例外 ， 相 应 的 文件 系统 被 称 为 NTFS (NT File System， 或 
称 为 NT 文件 系统 )。 但 是 ，NT 操作 系统 也 支持 其 他 的 文件 系统 ， 特 别 是 微软 早期 所 开发 的 
那些 文件 系统 ， 包 括 从 DOS 和 Windows 系统 那里 继承 来 的 FAT12、FAT16 和 FAT32 文件 系 
统 。XP 操作 系统 还 支持 面向 光盘 ( CD) 的 ISO 9660 只 读 光 盘 标准 格式 文件 系统 ( 即 NT 系 
统 中 的 CDFS)、UDF ( Universal Disc Format， 即 统一 光盘 格式 ) 文件 系统 、 面 向 可 擦 写 的 
光盘 和 数字 化 视频 光盘 的 ISO 13346 标准 格式 文件 系统 ， 源 自 OS/2 操作 系统 的 HPFS (High 
Performance File System， 即 高 性 能 文件 系统 ) 以 及 许 许 多 多 其 他 的 标准 文件 系统 。 考 虑 到 
没有 更 换 掉 OS/2 操作 系统 的 机 器 数量 太 少 ， 故 而 NT 操作 系统 后 来 无 暇 顾及 和 最 终 抛 弃 了 
对 HPFS 的 支持 。 在 开发 NT 操作 系统 的 时 候 ， 在 80x86 机 器 上 尚 没有 大 量 地 安装 任何 一 版 
的 UNIX 操作 系统 ， 于 是 微软 认为 显然 没有 必要 去 支持 任何 特定 的 UNIX 文件 系统 ， 所 以 就 
没有 在 这 方面 付 诸 任何 努力 。 
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18.5.1. NTFS 


我 们 首先 介绍 NTFS 的 几 项 一 般 特性 ， 然 后 讨论 NTFS 的 主要 目标 以 及 这 些 目 标 是 如 何 
实现 的 。 最 后 ， 我 们 将 就 NTFS 的 一 些 高 级 功能 特征 展开 进一步 的 论述 。NTFS 卷 的 基本 布 
局 如 图 18-5 所 示 。 

主 文件 表 

NTEFS 卷 的 引导 扇 区 包含 有 一 个 指针 指向 主 文件 表 ( Master File Table，MFT)。 文 件 系 
统 必须 记录 大 量 的 关于 文件 的 元 数据 (与 文件 自身 所 包含 的 数据 相对 而 言 )。 关 于 NTFS 卷 
自身 的 关键 元 数据 则 作为 特殊 的 系统 文件 而 存储 在 主 文件 表 中 。NTFS 卷 中 的 每 个 文件 或 目 
录 在 主 文件 表 中 都 有 一 条 对 应 的 1024 一 4096 字 节 长 的 记录 。 关 于 文件 和 目录 的 元 数据 作 
为 属性 ( attribute) 存放 在 主 文件 表 的 记录 中 。 属 性 就 是 我 们 通常 所 认为 的 文件 系统 目录 项 
的 相关 字段 。 鉴 于 给 定 文 件 所 需 的 属性 往往 可 能 因 文 件 的 类 型 而 有 很 大 变化 ， 所 以 大 多 数 的 
属性 被 存储 为 键 值 对 (pair)， 即 一 个 标识 符 和 一 个 取 值 。 其 中 某 些 属性 总 会 出 现 ， 故 而 存放 
在 相应 文件 的 主 文件 表 表 项 的 前 面 ， 但 大 多 数 的 属性 都 位 于 可 变 的 序列 中 。 鉴 于 每 条 主 文件 
表 记 录 的 大 小 是 有 限 长 的 ， 所 以 NTFS 采取 了 两 种 不 同 的 方式 来 存放 文件 的 有 关 属 性 : 或 者 
作为 常 驻 属性 ( resident attribute) 存放 在 主 文 件 表 记 录 (MFT record) 中 ， 或 者 作为 非常 驻 
属性 ( nonresident attribute) 存放 在 其 他 的 主 文件 表 记 录 中 或 文件 系统 的 非 主 文件 表 簇 中 的 
扩展 部 分 。 

e 常 驻 属性 。 仅 仅 要 求 少量 空间 的 属性 往往 保存 在 相应 文件 的 主 文件 表 记 录 中 。 大 多 
数 常见 的 文件 属性 都 是 常 驻 性 质 的 。 其 中 ,一 些 属性 要 求 是 常 驻 性 的 ， 例如， 包括 
文件 名 以 及 文件 创建 、 修 改 和 访问 的 日 期 (或 称 为 时 间 惟 ) 总 是 常 驻 性 的 。 图 18-6 
显示 了 一 条 具有 常 驻 属性 的 主 文件 表 记 录 。 





分 区 引导 筷 区 [3 


主 文件 表 表 项 首部 


(SDATA ) 


图 18-5 ”NTEFS 卷 布局 图 18-6 具有 常 驻 属性 的 主 文件 表 记 录 


e 非常 驻 属性 ( 亦 称 外 部 属性 ， 即 external attribute ) 。 如 果 一 项 属性 无 法 存放 在 主 文件 
表 记 录 中 ， 就 把 它 放 在 一 个 单独 的 地 方 ， 同 时 通过 在 主 文 件 表 中 设立 一 个 指针 给 出 
相应 属性 所 存放 的 位 置 。 非 常 驻 属 性 的 存储 分 为 两 种 情况 。 首 先 ， 如 果 指 向 属性 取 
值 的 指针 可 以 存放 在 相应 文件 的 主 文件 表 记 录 中 ， 那么 相应 的 取 值 就 被 存放 在 主 文 
件 表 记 录 之 外 的 称 为 扩展 盘 块 区 ( extent) 的 数据 盘 区 (data run， 或 称 为 数据 行程 ) 





日 ”从 技术 上 来 讲 ，NTFS 是 专利 性 质 的 ， 所 以 一 些 细节 往往 是 通过 观察 推断 出 来 的 ， 故 而 经 常会 存在 争议 。 
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中 ,并 且 指 向 相应 数据 盘 区 的 指针 被 放置 在 主 文件 表 记 录 中 。( 这 对 于 数据 属性 而 言 
在 大 多 数 情 况 下 都 是 成 立 的 , 但 从 理论 上 讲 ， 这 可 以 应 用 于 任何 属性 。) 图 18-7 显示 
了 一 条 具有 非常 驻 属性 的 主 文件 表 记 录 。 其 次 , 一 项 属性 也 可 能 存放 在 许多 不 同 的 
盘 区 (run， 或 称 为 行程 ) 中 ， 且 每 个 盘 区 具有 一 个 单独 的 指针 。 如 果 有 关 属 性 取 值 
具有 非常 多 的 扩展 盘 块 区 ， 以 至 于 指向 相关 扩展 盘 块 区 的 指针 甚至 都 无 法 存放 在 主 
文件 表 记 录 中 ， 故 而 整个 属性 就 可 能 要 外 迁 成 为 一 条 单独 的 主 文件 表 记 录 的 外 部 属 
性 甚至 是 多 条 外 部 记录 。 


文件 名 属性 值 (SFILE_NAME ) 


数据 属性 首部 
首部 


指向 第 一 个 数据 盘 区 起 始 能 的 指针 12 | | 政要 二 区 
名 第 二 
指向 第 二 个 数据 盘 区 起 始 入 的 指针 Wn 





图 18-7 具有 非常 驻 数 据 属 性 的 主 文件 表 记 录 


NTEFS 拥有 若干 预定 义 的 属性 。 其 中 ,一 些 属性 仅仅 与 一 个 文件 或 一 个 目录 相关 联 ， 或 
者 仅仅 与 有 关 卷 的 元 数据 中 的 某 种 其 他 结构 相关 联 ， 而 男 外 的 属性 则 与 一 个 以 上 的 结构 相关 
联 。 这 里 是 一 些 最 常见 的 NTFS 系统 所 定义 的 属性 : 


卷 名 (volume name)、 卷 信息 (volume information) 和 卷 版 本 (volume version ) 。 指 
卷 自身 的 键 名 : 版 本 和 其 他 的 元 数据 。 

位 图 。 指 包含 有 关于 簇 的 分 配 信息 的 位 图 。 这 一 属性 仅 会 被 有 关 位 图 元 数据 的 主 文 
件 表 记 录 所 使 用 。 

文件 名 。 指 文件 或 目录 的 名 称 。 一 个 文件 或 目录 可 能 具有 多 个 文件 名 属性 ， 以 允许 
微软 DOS 操作 系统 的 短文 件 名 或 者 支持 POSIX 实现 对 源 自 多 个 目录 的 硬 链接 。 
标准 信息 。 指 所 有 的 文件 和 目录 都 需要 的 数据 ， 壁 如 文件 创建 、 修 改 和 访问 的 日 期 
或 时 间 戳 ， 以 及 只 读 、 隐 藏 等 。 

索引 根 (index root) 。 指 针对 一 个 目录 中 的 所 有 文件 的 索引 。 如 果 目 录 很 小 ， 那 么 整 
个 索引 都 可 以 存放 在 主 文件 表 中 。 否 则 ， 某 些 信息 将 会 被 作为 非常 驻 属性 加 以 处 理 。 
安全 描述 符 ( security descriptor)。 指 控制 对 文件 或 目录 的 访问 的 信息 (例如 ， 所 有 
权 、 访 问 控制 表 和 审计 信息 )。 

属性 列表 (attribute list)。 这 是 一 个 元 属性 (meta-attribute)， 它 用 来 描述 其 他 的 属性 。 
如 果 一 项 属性 是 非常 驻 属 性 ， 那 么 该 属性 的 标识 符 将 被 放置 在 主 文 件 表 记 录 中 ， 同 
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时 拥有 一 个 指针 指向 相应 的 非常 驻 属性 。 
e 数据 。 一 个 文件 中 的 数据 就 是 “数据 "(data) 属性 的 取 值 。 如 果 一 个 文件 的 所 有 属性 
(包括 数据 ) 都 能 够 在 主 文件 表 记 录 中 放 得 下 ,那么 相应 数据 属性 将 会 驻 留 在 主 文件 
表 记 录 中 。 这 样 的 文件 不 需要 卷 上 的 其 他 存储 空间 ， 更 为 重要 的 是 ， 它 们 不 需要 额 
外 的 磁盘 访问 来 读 取 数据 ， 从 而 有 利于 性 能 的 提高 。 
越 大 的 文件 越 复杂 。 如 果 一 个 文件 的 所 有 属性 均 无 法 在 主 文件 表 记 录 中 放 得 下 ,那么 有 
关 属 性 将 被 设置 为 非常 驻 性 质 。 因 此 ， 大 多 数 的 文件 往往 把 它们 的 数据 存放 在 主 文件 表 记 录 
之 外 。 显 然 ， 文 件 的 属性 应 当 包括 指向 相应 数据 的 指针 。 某 些 很 大 的 文件 可 能 特别 大 ， 以 至 
于 连 指向 相应 数据 的 属性 都 无 法 在 主 文件 表 记 录 中 放 得 下 ， 从 而 使 其 自身 也 变 成 了 外 部 属性 。 
把 主 文件 表 连 续 地 保存 在 磁盘 上 有 助 于 提高 性 能 ， 因 此 在 初始 化 NTFS 卷 时 ， 紧 跟 主 文 
件 表 之 后 大 约 13% 的 磁盘 空间 被 保留 为 “ 主 文件 表 区 ”(MFT zone)。 这 部 分 空间 也 是 可 以 
利用 的 ,但 是 普通 的 文件 和 目录 只 有 在 空间 其 余部 分 用 完 之 后 才 会 使 用 这 部 分 空间 。 同 时 ， 
主 文件 表 最 终 也 有 可 能 用 完了 “ 主 文件 表 区 ”。 如 果 发 生 了 这 种 情况 ,那么 NTFS 将 会 为 主 
文件 表 分 配 更 多 的 空间 。 主 文件 表 的 这 种 分 裂 或 碎片 化 有 可 能 会 因 某 些 文件 所 需 读 取 操 作 数 
量 的 增加 而 造成 性 能 的 降低 ， 故 而 主 文件 表 通 常情 况 下 不 应 被 碎片 化 。 
空间 监测 
NTFS 以 簇 ( cluster， 即 由 扇 区 组 成 的 盘 块 ) 为 单位 来 分 配 磁盘 空间 。 同 时 ， 其 采用 位 
图 来 监测 每 个 簇 是 否 已 经 分 配给 了 一 个 文件 。 位 图 本 身 作为 一 个 特殊 的 系统 文件 而 存放 在 主 
文件 表 中 。 
通常 情况 下 ， 指 向 已 分 配给 文件 的 簇 的 有 关 指 针 一 起 保存 在 一 个 盘 块 中 。 在 第 12 章 中 ， 
我 们 把 这 些 盘 块 描 述 为 “索引 盘 块 "， 以 与 操作 系统 文献 中 的 标准 术语 保持 一 致 。( 这 一 术语 
不 应 当 与 NTFS 中 适用 于 目录 的 SINDEX 属性 发 生 混淆 。) 在 NTFS 中 ， 有 关 索 引 指针 给 出 
一 个 数据 盘 区 (data run， 或 称 为 数据 行程 ) 的 起 始 的 簇 号 。 其 中 ,数据 盘 区 是 指 一 个 连续 的 
秘 群 它们 均 被 分 配给 了 同一 文件 。 除 了 拥有 一 个 起 始 簇 的 编号 之 外 ， 相 应 数据 盘 区 的 长 度 
( 即 数据 盘 区 中 所 包含 的 连续 的 簇 的 计数 ) 也 被 记录 在 对 应 的 数据 盘 区 表 项 中 。 采 用 这 种 数 
据 盘 区 的 主 文件 表 记 录 如 图 18-7 所 示 。 
NTFS 主要 目标 
NTFS 拥有 两 项 主要 目标 : 高 可 靠 性 (high reliability) 和 安全 性 ( security)。 高 可 靠 性 
是 通过 两 个 不 同 的 方向 ， 即 崩溃 后 的 可 恢复 性 以 及 软件 数据 元 余 和 容错 (主要 是 廉价 磁盘 宛 
余 技 术 ) 同时 努力 来 达成 的 。 当 然 ， 除 了 这 三 项 主要 目标 之 外 ，NTFS 还 提供 了 许多 其 他 的 
高 级 功能 特征 。 
1 ) 可 恢复 性 ( recoverability)。 或 许 ，NTFS 设计 的 主要 目标 是 增加 文件 系统 在 面 对 崩 
省 时 的 可 靠 性 。 对 于 以 往 的 文件 系统 设计 方案 而 言 ， 如 果 控 制 整 个 文件 系统 的 数据 由 于 系 
统 异 常 关机 而 遭 到 破坏 ， 那 么 所 有 的 文件 或 者 大 部 分 文件 极 有 可 能 就 被 丢失 和 无 法 恢复 了 。 
为 了 增强 文件 系统 的 可 恢复 性 而 演化 形成 的 机 制 就 是 在 第 13 章 所 讨论 的 基于 日 志 的 文件 系 
统 (log-based file system) 或 日 志 式 文件 系统 (Journaling File System，JFS)。 每 当 对 文件 系 
统 的 元 数据 实施 任何 的 更 新 操作 时 ，NT 系统 首先 会 写 一 条 记录 到 日 志文 件 中 ， 以 罗列 所 需 
完成 的 更 新 操作 步骤 ， 相 关 这 组 步 又 被 称 为 事务 ( transaction)。 然 后 ， 再 逐一 实施 每 一 步 更 
新 操作 。 最 后 ， 还 需 就 元 数据 更 新 所 涉及 的 相关 所 有 文件 执行 相应 的 输入 /输出 操作 。 一旦 
这 一 系列 步骤 全 部 完成 ， 那 么 关于 相关 步骤 的 记录 应 当 从 日 志文 件 中 删除 。 如 果 系 统 停止 了 
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运转 ， 那 么 当 其 重新 启动 和 恢复 时 ， 应 检查 确认 是 否 存 在 某 项 更 新 事务 正在 进行 中 。 如 果 日 
志文 件 中 的 某 条 记录 表明 正在 进行 更 新 操作 ， 那 么 操作 系统 应 当 能 够 识别 出 哪 部 分 操作 尚未 
成 功 完 成 。 进 一 步 说 ， 如 果 系 统 可 以 完成 该 项 事务 ， 就 继续 实施 完成 该 项 事务 ; 而 如 果 系 统 
不 能 完成 有 关 事 务 ， 则 需要 就 已 经 完成 的 部 分 实施 恢复 操作 。 这 样 ， 整 个 文件 系统 将 始终 处 
于 有 效 状 态 。 即 便 某 些 应 用 程序 的 数据 有 可 能 已 被 丢失 ， 但 至 少 文件 系统 可 以 继续 使 用 ， 同 
时 无 须 担 忧 将 来 还 有 其 他 数据 会 因 文件 系统 已 陷入 损坏 状态 而 被 丢失 。Vista 版 操作 系统 还 
包括 所 谓 卷 影 复制 和 事务 支持 的 功能 选项 ， 可 以 为 数据 文件 提供 保护 。 相 关 特 性 将 会 在 第 
18.5.5 节 中 展开 进一步 讨论 。 

当然 ， 这 些 额 外 的 步骤 会 需要 额外 的 时 间 开 销 ， 并 会 增加 磁盘 驱动 器 的 负载 。 不 过 ， 鉴 
于 NT 操作 系统 主要 是 为 个 人 计算 机 而 设计 的 ， 所 以 额外 的 负载 还 是 可 以 容忍 的 。 毕 况 ， 系 
统 在 大 多 数 情况 下 并 不 可 能 是 过 载 工 作 的 。 同 时 ，NTFS 的 其 他 设计 要 素 也 使 得 其 某 些 性 能 
增益 要 高 于 NT 系统 所 支持 的 其 他 文件 系统 。 因 此 ， 鉴 于 NTFS 相 比 于 其 他 微软 文件 系统 所 
具有 的 更 高 的 可 靠 性 ，NTFS 的 整体 性 能 还 是 可 以 接受 的 。 男 一 方面 ， 如 果 系 统 发 生 月 演 且 
有 关 文 件 系 统 不 是 基于 日 志 的 系统 ， 那 么 保险 的 做 法 是 运行 一 个 实用 例 程 来 检查 文件 系统 的 
完整 性 。 但 在 拥有 许 许多 多 文件 的 系统 上 ， 这 将 可 能 花 上 好 几 个 小 时 才 可 能 完成 。 显 然 ， 在 
用 作 服 务 器 的 系统 上 ， 如 此 漫长 的 延迟 是 不 可 接受 的 。 在 这 些 情况 下 ， 把 有 关 性 能 影响 分 散 
开 来 是 更 为 合理 的 ， 也 就 是 说 ， 应 当 把 相应 完整 性 的 保证 分 布 在 正常 的 日 常 操作 中 ， 而 不 是 
在 系统 崩溃 后 触发 和 一 次 性 完成 。 

2 ) 数据 匈 余 ( data redundancy) 和 容错 性 (fault tolerance， 或 称 为 容错 能 力 )。NT 系 
统 的 另 一 项 磁盘 可 靠 性 特征 是 支持 三 种 不 同 的 软件 版 廉价 磁盘 元 余 阵 列 (Redundant Array 
of Independent Disk，RAID) 构 型 。 关 于 廉价 磁盘 元 余 阵 列 ， 曾 经 在 第 14 章 进 行 过 较为 详 
尽 的 讨论 。NT 操作 系统 支持 的 廉价 磁盘 元 余 阵 列 形 式 包 括 RAID-0、RAID-1 和 RAID-5。 
RAID-0 完 完 全 全 是 用 来 增强 性 能 的 ， 没 有 提供 更 高 的 可 靠 性 。RAID-1 则 是 完全 镜像 ， 也 就 
是 说 ， 写 人 一 个 驱动 器 的 所 有 内 容 都 会 自动 写 到 另 一 个 驱动 器 ,故而 提供 了 良好 的 可 靠 性 ， 
不 过 需要 付出 较 高 的 硬件 成 本 。 对 于 RAID-5 来 说 ， 对 应 于 一 组 数据 块 会 同时 写 和 人 一 个 奇偶 
校 验 块 ， 其 以 较 低 的 硬件 成 本 提供 了 和 良好 的 可 靠 性 ， 但 会 增加 软件 开销 。 当 然 ， 硬 件 版 廉价 
磁盘 元 余 阵列 系统 可 以 与 NT 操作 系统 联合 使 用 ， 而 不 是 局 限于 使 用 软件 解决 方案 层面 上 。 

3 ) 安全 性 。 在 NT 系统 中 ， 对 象 是 操作 系统 所 有 数据 结构 的 基本 构件 ， 在 这 些 数 据 结 
构 中 就 包括 文件 和 目录 。 每 一 个 对 象 都 有 一 个 所 有 者 ， 即 最 初创 建 相应 对 象 的 实体 。 利 用 访 
问 控制 表 (Access Control List，ACL)， 安 全 性 可 以 施加 到 任何 对 象 上 。 或 许 你 还 记得 ,一 
个 实体 的 访问 控制 表 列 出 了 允许 操作 对 象 的 有 关 实 体 (包括 组 和 和 角色) 以 及 允许 对 应 实体 所 
执行 的 相应 操作 列表 。 所 有 者 可 以 对 访问 控制 表 执 行 若 干 种 操作 ， 包 括 直接 对 其 进行 修改 、 
授权 其 他 实体 对 其 进行 修改 以 及 设置 其 他 实体 成 为 所 有 者 。 在 NTFS 中 , 文件 或 目录 的 访问 
控制 表 存储 为 相应 对 象 的 属性 。NTFS 中 所 使 用 的 权限 如 下 : 


y R 一 一 读 

火 W 一 一 写 

秃 尺 一 一 执行 

x* _D 一 一 删除 

类 了 一 一 修改 访问 控制 表 

* 0 一 一 将 当前 账户 设 为 新 的 所 有 者 (“ 获 得 所 有 权 ”) 
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18.5.2 NTFS 高 级 功能 特征 


NTFS 包含 有 许多 支持 应 用 程序 的 高 级 功能 。 其 中 一 些 功 能 以 应 用 程序 接口 调用 的 方式 
供应 用 程序 使 用 ， 而 男 外 一 些 功 能 则 只 能 在 其 内 部 使 用 : 


只 读 支持 ( read-only support)。 在 XP 版 操作 系统 之 前 的 NTFS 要 求 卷 位 于 可 写 介质 
上 面 ， 以 便 其 能 够 写 操作 事务 日 志文 件 。XP 操作 系统 则 引入 了 可 以 在 只 读 介 质 上 
挂 载 卷 的 驱动 程序 。 对 于 拥有 NTFS 格式 只 读 卷 的 伐 人 式 系 统 来 说 ， 这 项 功能 非常 
必要 。 

碎片 整理 (defragmentation)。NTFS 并 没有 特别 设法 来 保持 文件 存储 的 连续 性 。 但 是 ， 
它 提供 了 一 个 关于 碎片 整理 的 应 用 程序 接口 ， 相 关 应 用 程序 可 以 通过 调用 该 接口 来 
迁移 文件 数据 ， 从 而 使 有 关 文 件 占 用 连续 的 簇 。NT 操作 系统 还 包含 有 一 个 碎片 整理 
工具 ， 不 过 该 工具 存在 若干 方面 的 限制 。 相 比 之 下 ,第 三 方 提供 的 此 类 产品 往往 拥 
有 更 为 丰富 的 功能 。 

卷 挂 载 点 (volume mount point)。 这 类 似 于 UNIX 系统 的 挂 载 点 。 在 NTFS 中 ， 这 便 
支持 其 他 文件 系统 的 可 见 性 且 无 须 为 每 个 文件 系统 配备 单独 的 驱动 器 号 。 对 于 远程 
卷 也 是 如 此 。 

POSIX 支持 。NT 操作 系统 的 目标 之 一 是 支持 POSIX 标准 。 对 于 文件 系统 来 说 ， 这 
便 要 求 支 持 区 分 字母 大 小 写 的 文件 名 和 目录 名 、 一 种 不 同 的 在 解析 路 径 名 时 确定 访 
问 权 限 的 方法 以 及 不 同 的 时 间 戳 语义 集 。 这 些 功 能 与 NT 系统 自身 均 不 兼容 。NTFS 
包含 有 这 些 可 选 的 支持 POSIX 的 功能 。 

加 密 。 当 笔记 本 电脑 丢失 或 被 瓷 时 ， 存 储 在 笔记 本 电脑 上 的 数据 有 可 能 被 暴露 。 在 
这 种 情况 下 ,文件 系统 保护 做 得 并 不 到 位 ， 因 为 相关 卷 可 以 由 不 要 求 NT 操作 系统 
运行 的 软件 来 读 取 。 此 外 ， 当 另 一 个 用 户 可 以 使 用 具有 管理 员 特 权 的 账户 时 ，NTEFS 
的 文件 权限 是 毫 无 用 处 的 。 因 此 NTEFS 包含 了 一 项 称 为 加 密 文 件 系统 ( Encrypting 
File System，EFS) 的 功能 来 加 密 存 储 在 数据 属性 中 的 数据 。 加 密 文 件 系统 对 应 用 程 
序 是 完全 透明 的 。 只 有 利用 账户 的 加 密 文件 系统 的 私 钥 / 公 钥 对 中 的 私 钥 才能 访问 加 
密 文 件 ， 并 且 私 钥 被 采用 账户 的 密码 进行 了 锁定 ， 所 以 在 没有 授权 账户 的 密码 的 情 
况 下 是 无 法 读 取 对 应 的 文件 的 。 

卷 影 复制 ( volume shadow copy)。 这 项 服务 通过 把 被 覆盖 ( 即 改写 前 ) 的 数据 复制 
到 隐藏 的 影子 备份 区 域 ， 从 而 保存 了 NTFS 卷 上 的 文件 和 文件 夹 的 历史 版 本 。 于 是 ， 
有 关 用 户 以 后 就 能 够 请 求 切换 回 较 早 的 版 本 。 这 项 功能 允许 备份 程序 归档 当前 正在 
使 用 的 文件 。 

链接 跟踪 (link tracking)。 快 捷 方式 允许 用 户 在 其 桌面 上 放置 文件 。 类 似 地 ， 对 象 链 
接 和 杏 人 ( Object Linking and Embedding，OLE) 允许 源 自 一 个 应 用 程序 的 文档 被 链 
接 为 其 他 应 用 程序 的 文档 。 这 种 链接 提供 了 一 种 简单 的 使 文件 彼此 连接 的 方法 ,但 
是 这 些 链 接 比 较 难 以 管理 ， 因 为 如 果 有 关 用 户 移动 了 一 个 链接 对 应 的 目标 ， 那么 相 
应 链接 将 会 被 断 开 。 为 此 ，NTFS 支持 分 布 式 链接 跟踪 ， 也 就 是 说 ， 当 链接 目标 发 生 
移动 时 ， 系 统 将 会 维护 源 自 命令 解释 器 命令 的 文件 链接 以 及 对 象 链接 和 艇 入 中 相关 
链接 的 完整 性 。 利 用 NTFS 链接 跟踪 支持 ， 如 果 一 个 位 于 NTFS 卷 上 的 链接 目标 移 
动 到 了 相同 域 中 的 另 一 个 NTFS 卷 上 ， 那 么 有 关 链 接 跟踪 服务 能 够 同步 更 新 链接 以 
反映 这 种 移动 情况 。 


党 18 竟 从 WindomwsNT 到 Jindomws Vista 361 


单 实例 存储 ( Single Instance Storage，SIS)。 有 时 ， 几 个 目录 均 包 含 具 有 相同 内 容 
的 文件 。 单 实例 存储 允许 把 相同 的 文件 缩减 为 一 个 物理 文件 以 及 对 该 物理 文件 的 许 
多 单 实 例 存储 引用 。 单 实例 存储 是 一 个 用 于 管理 文件 变化 的 文件 系统 过 滤器 以 及 一 
项 用 于 搜索 内 容 相同 且 需要 合并 的 文件 的 服务 。 与 仅仅 指向 一 个 文件 的 硬 链接 不 同 ， 
在 文件 系统 的 外 部 来 看 ， 每 个 单 实例 存储 文件 仍然 是 不 同 的 ， 并 且 对 一 个 文件 的 一 
个 副本 的 改变 不 会 改变 其 他 的 文件 。 对 于 发 生 更 改 的 一 个 单 实例 存储 文件 来 说 ， 系 
统 将 会 为 其 男 外 创建 一 个 不 同 的 副本 。 

每 用 户 磁 盘 空 间 配 额 ( per-user disk space quota)。 管 理 员 经 常 需 要 监测 或 限制 用 户 
对 磁盘 空间 的 使 用 情况 ， 特 别 是 在 服务 器 上 ， 因 此 NTFS 包含 了 对 配额 管理 的 支持 ， 
允许 为 每 个 用 户 指 定 相 应 的 磁盘 空间 配额 。 

更 改 日 志 (change logging)。 有 时 ， 应 用 程序 需要 监控 卷 上 的 文件 和 目录 的 更 改 
情况 。 例 如 ， 当 文件 发 生变 化 时 ， 自 动 备份 程序 可 能 会 执行 增 量 备份 ( incremental 
backup)。 为 了 实现 这 一 目标 ,一 种 方案 是 相关 应 用 程序 扫描 对 应 卷 并 记录 文件 和 目 
录 的 状态 ， 然 后 在 稍 后 的 扫描 过 程 中 ， 进 一 步 检 查 前 后 是 否 存在 差异 。 然 而 ， 有 关 
过 程 显然 可 能 会 使 系统 缓慢 下 来 ， 尤 其 是 在 计算 机 通常 拥有 成 千 上 万 的 文件 的 情况 
下 。 为 此 ，NTEFS 允许 应 用 程序 请 求 NTFS 把 有 关 文 件 和 目录 更 改 的 信息 记录 到 一 个 
称 为 变更 日 志 (change journal) 的 特殊 文件 中 。 在 此 基础 之 上 ， 相 关 应 用 程序 可 以 读 
取 更 改 日 志 ， 而 不 是 去 扫描 整个 目录 树 。 

事务 支持 。 使 用 Vista 操作 系统 ， 应 用 程序 可 以 采用 事务 把 文件 的 更 改 操作 划分 和 编 
组 到 一 个 事务 中 。 事 务 保 证 要 么 所 有 的 更 改 都 发 生 ， 要 么 任何 更 改 都 不 发 生 ， 并 且 
将 会 保证 事务 外 的 应 用 程序 只 有 在 事务 提交 之 后 才 会 看 到 对 应 的 更 改 结果 。 事 务 通 
常 在 数据 库 系 统 和 NTFS 元 数据 中 都 得 到 了 支持 。 这 项 功能 把 基于 事务 的 系统 的 可 
靠 性 延伸 到 了 普通 文件 上 。 

压缩 (compression) 和 稀疏 文件 (sparse file)。NTFS 支持 压缩 文件 数据 。 压 缩 和 解 
压缩 (decompression) 是 透明 的 ， 因 此 不 必修 改 应 用 程序 就 能 够 利用 这 项 功能 。 目 
录 也 可 以 被 压缩 ， 同 时 被 压缩 目录 中 的 任何 文件 都 会 自动 地 被 压缩 。NTFS 还 有 一 
种 称 为 稀 玖 文件 的 相关 机 制 。 进 一 步 说 ， 如 果 一 个 文件 被 标记 为 稀疏 特性 ， 那 么 
NTFS 将 不 会 在 卷 上 为 该 文件 的 空白 部 分 ( 即 无 效 部 分 ) 分 配 空间 。 当 应 用 程序 从 
稀疏 文件 的 空白 区 域 读 取 数 据 时 ，NTES 将 会 返回 用 0 填充 的 缓冲 区 。 与 压缩 文件 
(compressed file) 一 样 ， 稀 玖 文件 通常 对 于 应 用 程序 也 是 透明 的 ， 尽 管 当 处 理 文件 中 
实际 上 为 空 的 部 分 的 时 候 ， 应 用 程序 可 能 会 意识 到 稀 朴 文件 并 且 可 能 会 节省 大 量 的 
处 理 器 和 内 存 资 源 开 销 。 

别名 (aliase)。NTFS 支持 硬 链接 (hard link) 和 符号 链接 ( symbolic link) 。 硬 链 
接 允 许多 个 路 径 引用 同一 个 文件 ， 相 关 实 现 与 第 12 章 中 讨论 的 一 样 。 为 了 防止 陷 
人 查找 循环 ，NTFS 采用 了 一 种 简单 的 方法 ， 即 不 允许 硬 链 接 对 目录 进行 引用 。 另 
外 ，NTFS 把 符号 链接 称 为 联结 点 (junction)， 而 联结 点 则 建立 在 一 种 所 谓 重 解析 点 
( reparse point) 的 更 通用 的 机 制 的 基础 之 上 。 重 解析 点 是 指 能 够 被 输入 /输出 管理 器 
所 读 取 的 关于 文件 或 目录 的 额外 属性 ， 例 如 相应 文件 或 目录 的 当前 位 置 。 在 文件 或 
目录 查找 期 间 ， 当 NTFS 命中 一 个 重 解析 点 时 ， 它 将 会 告知 输入 /输出 管理 器 检查 相 
应 的 重 解析 数据 ( reparse data) 。 然 后 ， 输 入 /输出 管理 器 可 以 更 改 原 先 操 作 中 所 指 
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定 的 路 径 名 ， 并 让 NTFS 用 更 改 后 的 路 径 重 新 开始 查找 。 重 解析 点 也 可 以 被 磁带 归 
档 软 件 所 使 用 以 说 明 一 个 文件 已 被 迁移 到 归档 系统 。 有 关 磁 带 归 档 软 件 把 文件 移动 
到 磁带 上 ， 并 在 其 目录 项 中 留 下 重 解析 点 ， 以 告知 相关 软件 对 应 文件 当前 所 在 的 位 
置 。 当 进程 尝试 访问 一 个 已 经 归档 的 文件 时 ， 驱 动 程序 将 会 从 对 应 目录 中 移 除 重 解 
析 点 属性 ， 把 文件 数据 从 归档 介质 读 回 到 原先 的 介质 上 ， 然 后 重新 进行 访问 。 因 此 ， 
对 于 访问 归档 文件 的 进程 来 说 ， 离 线 数 据 的 检索 是 透明 的 。 当 然 ， 在 这 种 情况 下 的 
文件 打开 操作 可 能 需要 花费 比 正 常情 况 稍 长 一 点 的 时 间 。 

e 动态 坏 簇 处 理 (dynamic bad-cluster handling)。 如 果 数 据 读 取 操 作 访问 了 一 个 损坏 的 
磁盘 扇 区 ， 那 么 读 操作 失败 ， 并 且 有 关 数 据 无 法 再 用 。 然 而 ， 如 果 对 应 磁盘 是 具有 
容错 能 力 ( 壁 如 廉价 磁盘 元 余 阵 列 ) 的 卷 ， 则 驱动 器 将 会 获取 相应 数据 的 一 份 好 的 副 
本 ， 并 且 告 知 NTFS 对 应 扇 区 已 经 损坏 。 于 是 ，NTEFS 将 会 在 发 生 故 障 的 驱动 器 上 分 
配 一 个 新 簇 来 蔡 代 坏 徐 ， 并 把 有 关 数 据 复制 到 那里 。 鉴 于 NTFS 已 经 对 坏 簇 进行 了 
标记 ， 故 而 以 后 将 会 对 其 忽略 和 不 予 理 皮 。 

e 索引 (indexing)。NTFS 支持 对 磁盘 卷 上 的 任何 文件 属性 进行 索引 。 索 引 会 对 有 关 

属性 进行 排序 。 利 用 索引 机 制 ， 可 使 文件 系统 能 够 快速 地 找到 满足 任何 条 件 的 文件 ， 

例如 去 找 出 某 个 目录 中 的 所 有 文件 。 

复杂 文件 名 (complex file name)。NTEFS 使 用 Unicode 字符 来 存储 文件 、 目 录 和 卷 的 

名 称 。Unicode 是 一 种 16 位 字符 编码 方案 ,支持 世界 上 的 每 种 主要 语言 中 的 每 个 字 

符 被 唯一 地 表示 。 路 径 名 称 中 的 每 项 要 素 最 多 可 以 包含 255 个 字符 ， 并 且 可 以 包含 

Unicode 字符 、 空 格 和 多 个 句点 。 

e 多 个 数据 流 (mnultiple data stream， 或 称 之 为 多 重 数据 流 )。 在 NTFS 中 ,文件 的 数 
据 被 认为 是 对 应 文件 的 一 种 属性 ， 称 为 数据 流 ( data stream)。 可 以 由 应 用 程序 添加 
新 的 属性 ， 包 括 附 加 的 数据 流 ， 所 以 文件 (和 目录 ) 可 能 包含 多 个 数据 流 。NT 操 
作 系 统 利 用 一 个 备用 的 数据 流 (简称 备用 流 ) 把 用 户 的 “特性 ”与 文件 关联 到 一 起 ， 
例如 标题 、 主 题 、 作 者 和 关键 字 。 同 时 ， 它 将 日 期 存储 在 称 为 摘要 信息 ( summary 
information) 的 备用 流 中 。 


18.6 基本 输入 / 输出 


从 图 18-8 中 ,我 们 可 以 更 为 清晰 地 看 到 NT 操作 系统 的 整个 文件 系统 的 体系 结构 。 遗 
憾 的 是 ， 就 像 操 作 系统 文献 经 常 发 生 的 那样 ， 我 们 在 本 教材 中 所 使 用 的 名 称 与 NT 系统 设计 
人 员 所 使 用 的 名 称 往往 会 发 生 冲 突 。 例 如 ， 他 们 把 输入 /输出 系统 的 顶层 称 为 “输入 /输出 
管理 器 "， 而 我 们 则 已 经 将 该 术语 用 于 操作 系统 的 较 低 层级 的 输入 /输出 功能 上 。 在 本 章 中 ， 
我 们 将 采用 微软 所 使 用 的 术语 。 因 此 ， 我 们 在 上 一 节 中 所 描述 的 功能 实际 上 是 由 分 区 / 卷 存 
储 管理 器 和 磁盘 类 管理 器 所 承载 的 。 


418 人 -分 区 


因为 个 人 计算 机 中 的 硬盘 驱动 器 支持 是 源 自 于 微软 或 DOS 操作 系统 所 采用 的 设计 方案 ， 
所 以 个 人 计算 机 上 的 任何 操作 系统 都 会 支持 某 些 相同 的 事情 。 首 先 ， 有 关 设 计 支 持 系统 管理 
员 把 磁盘 驱动 器 划分 为 所 谓 分 区 (partition) 的 单独 区 域 。 在 此 基础 上 ， 管 理 员 将 会 使 用 操 
作 系统 实用 程序 在 每 个 分 区 中 建立 一 个 单独 的 文件 系统 。 这 些 文 件 系 统 甚至 可 以 是 其 他 操作 
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系统 原生 的 文件 系统 。 输 入 /输出 系统 把 每 个 分 区 看 作 是 一 个 单独 的 驱动 器 。 与 文件 系统 一 
样 ， 分 区 结构 的 设计 不 得 不 演化 改进 以 应 对 硬盘 的 不 断 增 大 的 容量 。 分 区 机 制 在 硬盘 的 所 谓 
主 引导 块 (Master Boot Block，MBB ) 或 主 引导 记录 (Master Boot Record，MBR ) 的 第 一 扇 
区 中 创建 了 一 张 小 表 。 原 有 机 制 在 单个 磁盘 上 只 能 创建 4 个 分 区 。 后 来 进行 了 扩展 ， 人 允许 一 
个 分 区 被 指定 为 扩展 分 区 (extended partition)， 从 而 允许 在 一 个 磁盘 上 最 多 可 以 创建 24 个 
逻辑 分 区 。 








图 18-8 NT 操作 系统 输入 /输出 体系 结构 


18.6.2 输入 /输出 系统 分 层 


输入 /输出 系统 的 分 层 允许 把 新 增 的 额外 层次 方便 地 插入 整个 操作 系统 的 体系 结构 中 。 
在 许多 情况 下 ，NT 输入 /输出 驱动 程序 会 在 它们 的 供 其 用 来 调用 下 一 较 低层 级 驱动 程序 的 
应 用 程序 接口 上 公开 相同 的 调用 ， 并 且 任 何 给 定 层级 的 每 个 替代 模块 都 会 实现 相同 的 接口 。 
除 此 之 外 ， 这 种 分 层 还 允许 把 一 个 逻辑 设备 定义 在 一 个 实际 上 并 非 本 地 磁盘 分 区 而 是 位 于 网 
络 上 的 另 一 台 机 器 的 系统 上 。 在 这 种 情况 下 ， 系 统 将 会 执行 一 个 重 定向 ( redirection) 操作 ， 
从 而 使 得 对 于 用 户 和 程序 来 说 ， 网 络 设备 看 起 来 与 本 地 设备 并 没有 什么 区 别 。 有 关 分 层 还 允 
许 某 个 设备 看 起 来 就 像 是 磁盘 驱动 器 ， 但 它 实 际 上 是 别 的 什么 东西 一 一 譬如 一 个 通用 串 行 总 
线 接口 标准 的 闪存 驱动 器 。 

这 种 分 层 还 允许 在 层级 之 间 搬 人 额外 的 功能 。 它 们 将 会 在 系统 引导 时 以 一 种 所 谓 过 滤 顺 
( filter) 的 特殊 类 型 的 设备 驱动 程序 的 形式 进行 加 载 。 对 于 一 般 普通 用 户 可 能 并 不 想 要 任何 
额外 功能 的 简单 情况 来 说 ， 仅 需 付出 很 少 的 开销 便 可 以 支持 基本 的 输入 /输出 功能 。 但 当 一 
个 用 户 确实 想 要 某 种 外 来 的 功能 时 ， 有 关 补 充 的 功能 可 以 采取 一 种 无 论 对 较 高 层级 还 是 对 较 
低层 级 都 透明 的 方式 而 插入 两 个 层级 之 间 。 病 毒 扫 描 器 就 是 此 类 补充 功能 的 一 个 例子 。 通 过 
在 层级 之 间 提 供 有 关 接 口 ，NT 操作 系统 就 能 够 支持 第 三 方 软件 方便 地 扩展 输入 /输出 系统 
的 功能 ， 且 不 会 破坏 操作 系统 代码 的 完整 性 。 还 有 ， 由 于 这 种 定义 良好 的 标准 分 层 接口 ， 如 
果 有 任何 意料 之 外 的 功能 将 来 被 开发 出 来 ， 也 很 容易 就 能 够 被 添加 到 输入 /输出 系统 中 。 


18.6.3” 即 插 即 用 
在 编写 操作 系统 时 ， 其 被 认为 是 一 个 通用 实体 ， 能 够 运行 在 各 种 各 样 的 硬件 配置 平台 
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上 。 但 是 ， 当 我 们 在 一 台 特 定 的 机 器 上 安装 操作 系统 的 时 候 ， 必 须 按照 与 所 安装 的 硬件 相 匹 
配 的 方式 来 对 其 进行 配置 。 如 果 以 后 添加 了 新 硬件 或 者 更 换 或 移 除 了 旧 硬 件 ， 则 必须 对 操作 
系统 进行 调整 以 适应 新 的 机 器 配置 。 我 们 需要 新 硬件 的 驱动 程序 ， 同 时 我 们 也 不 想 把 空间 浪 
费 给 那些 不 再 需要 的 驱动 程序 。 

对 于 早期 的 大 型 主机 来 说 ， 在 安装 操作 系统 或 对 操作 系统 进行 升级 的 时 候 ， 常 常会 看 到 
系统 编程 人 员 要 执行 一 条 sysgen 命令 (用 于 生成 系统 )。 简 单 来 说 ， 这 就 相当 于 利用 一 个 规 
格 记 录 文 件 来 描述 硬件 配置 ， 然 后 将 该 规格 记录 文件 用 于 生成 专 为 适应 有 关 硬 件 而 定制 的 操 
作 系 统 的 可 执行 版 本 。 对 于 中 等 大 小 的 配置 来 说 ， 这 项 工作 往往 会 花 上 几 天 ， 有 时 需要 尝试 
多 次 才能 够 实现 正常 运行 。 

原来 的 IBM PC 是 那个 时 代 的 典型 的 硬件 系统 ， 而 配置 DOS 操作 系统 以 适应 硬件 则 
是 非常 困难 的 事情 。 配 置 大 多 数控 制 器 往往 需要 2~4 种 不 同 的 信息 ， 包 括 中 断 请 求 级 
( Interrupt Request Level，IRQ)、 存 储 器 地 址 ( memory address)、 输 入 /输出 端口 (地址 ) 以 及 
内 存 直 接 存 取 (Direct Memory Access, DMA) 型 通道 号 。 这 些 都 是 利用 控制 器 板 〈controller 
board) 上 的 小 型 开关 ( switch) 或 跳 线 (jumper) 手动 设置 完成 的 。 有 关 地 址 必须 谨慎 选择 ， 
以 确保 它们 不 会 相互 冲突 。 在 机 器 中 安装 一 个 新 的 控制 器 则 可 能 具有 相当 的 挑战 性 ， 因 为 通 
常 很 难 在 现 有 的 板 卡 上 找到 相应 的 设置 。 另 一 方面 ， 必 须 得 使 用 一 个 所 谓 config.sys 的 文件 
来 对 相关 硬件 加 以 描述 ， 从 而 使 操作 系统 掌握 机 器 的 硬件 配置 情况 。 通 常情 况 下 ， 硬 件 供应 
商会 提供 一 个 实用 程序 ， 以 试图 调整 文件 config.sys 的 内 容 来 适应 新 的 硬件 ， 但 是 他 们 往往 
会 由 此 导致 更 多 的 问题 ， 而 不 是 修复 问题 。 

从 IBM MicroChannel ( 微 通道 ) 和 EISA (Extended Industry Standard Architecture ， 扩 
展 版 企业 标准 架构 ) 总 线 开 始 ， 相 关 控 制 器 已 能 够 向 操作 系统 标识 自己 的 身份 ， 并 能 够 对 软 
件 引 发 的 配置 更 改 做 出 响应 。 这 项 功能 被 称 为 即 插 即 用 (plug and play， 有 时 简 记 作 PnP )。 
使 用 PCI 总 线 后 ， 这 种 趋势 得 以 延续 ， 并 且 当 前 大 多 数 操作 系统 都 能 够 识别 大 多 数 新 的 硬 
件 、 动 态 地 设置 板 卡 的 参数 、 选 择 能 够 与 现 有 硬件 配置 一 起 正常 工作 的 配置 方案 ， 以 及 通过 
为 有 关 硬 件 动态 地 加 载 正 确 的 设备 驱动 程序 来 定制 操作 系统 。 当 然 操 作 系统 仍然 需要 调整 才 
能 够 适应 硬件 ， 不 过 相关 过 程 通常 由 操作 系统 动态 地 来 完成 ， 并 且 对 用 户 来 说 ， 有 关 操 作 变 
得 更 加 透明 。 


18.6.4 设备 驱动 程序 


输入 /输出 设备 的 所 有 硬件 特性 都 被 隔离 在 内 核 的 最 低层 级 ， 即 设备 驱动 程序 中 。 例 
如 ， 这 便 意味 着 ， 所 有 较 高 层级 的 模块 不 应 当 去 关心 一 条 磁道 上 有 多 少 个 鹿 区 或 一 个 磁盘 驱 
动 器 拥有 多 少 个 读 / 写 磁头 。 同 时 ， 它 们 也 不 应 该 关心 状态 寄存 器 中 的 哪些 位 用 来 指示 发 生 
了 错误 。 相 反 ， 它 们 应 该 专注 于 对 所 有 磁盘 驱动 器 来 说 都 通用 的 东西 ， 并 把 任何 特定 设备 
(或 控制 器 ) 的 细节 信息 限制 在 相应 特定 设备 或 控制 器 的 设备 驱动 程序 内 部 。 

由 于 NT 操作 系统 使 用 这 样 的 设备 驱动 程序 来 隐藏 相关 硬件 的 细节 ， 所 以 很 容易 就 能 
够 改变 NT 系统 的 硬件 配置 。 实 际 上 ， 有 关 驱 动 程 序 可 以 动态 地 安装 到 系统 中 或 者 从 系统 中 
移 除 。 这 意味 着 ， 当 一 部 设备 添加 到 系统 中 时 ， 无 须 重 新 启动 操作 系统 。 在 这 种 新 方案 之 
前 ， 当 相关 硬件 发 生 改 变 时 ， 系 统 重新 启动 则 是 必须 的 。 显 然 ， 重 启 系统 是 非常 耗 时 的 ， 而 
且 对 于 诸如 服务 器 等 非常 重要 的 系统 来 说 ， 这 也 是 令 人 难以 接受 的 。 对 于 以 物理 方式 插 人 
总 线 的 设备 控制 器 〈 例 如 ， 新 的 图 形 卡 ) 来 说 ， 系 统 电源 无 论 如 何必 须 得 关闭 ， 因 此， 这 
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种 情况 下 的 非得 重新 启动 系统 并 不 是 什么 问题 。 然 而 ， 几 种 用 来 把 外 围 设备 连接 到 计算 机 
的 新 方法 都 假定 相应 设备 是 外 部 的 ， 比 如 录像 机 (Video Cassette Recorder，VCR ) 或 便携 
式 摄像 机 (camcorder)， 因 此 关闭 电源 就 不 再 是 必要 的 。 此 类 接口 的 示例 包括 通用 串 行 总 线 
( Universal Serial Bus，USB)、IEEE 1394 以 及 PC 卡 (PC Card) 或 插件 总 线 (Card Bus， 以 
前 称 为 PCMCIA ， 全 称 是 Personal Computer Memory Card International Association， 即 个 人 
计算 机 内 存 卡 国 际 联合 会 ) 等 。 此 外 ， 还 为 这 些 接口 定义 了 协议 ， 使 得 有 关 设 备 可 以 采用 类 
似 于 PCI 总 线 的 即 播 即 用 特征 的 方式 向 计算 机 标明 其 自己 的 身份 。 这 种 动态 识别 意味 着 ， 对 
于 任何 新 安装 的 设备 来 说 ， 操 作 系 统 可 以 自动 加 载 相应 的 驱动 程序 ， 且 无 须 重 新 启动 操作 系 
统 ; 除了 可 能 需要 用 户 提供 包含 对 应 设备 的 驱动 程序 的 只 读 光 盘 外 ， 通 常情 况 下 并 不 需要 用 
户 的 任何 其 他 帮助 。 大 多 数 用 户 还 会 在 不 关闭 电源 的 情况 下 把 设备 连接 到 串 行 端口 或 并 行 端 
口上 ， 尽 管 此 类 设备 的 制造 商 通常 不 推荐 这 样 做 。 不 过 ， 通 过 这 些 端口 连接 的 设备 可 能 无 法 
自动 地 标明 自己 的 身份 ， 这 和 那些 使 用 较 新 接口 的 设备 是 不 一 样 的 。 


18.6.5 ”磁盘 类 、 端 口 及 微型 端口 的 驱动 程序 


一 般 来 说 ， 文 件 系统 模块 会 调用 位 于 较 低 的 逐渐 向 硬件 靠拢 的 层级 上 的 存储 驱动 程序 
( storage driver) 的 功能 。/ 相 关 层 级 分 别 被 称 为 存储 类 (storage class， 这 里 即 磁 盘 类 ， 也 就 
是 disk class) 驱动 程序 、 存 储 端口 ( storage port) 驱动 程序 以 及 微型 端口 (miniport) 驱动 程 
序 。 在 最 上 层 ，NT 操作 系统 提供 了 存储 类 驱动 程序 ， 其 实现 了 面向 所 有 特定 类 型 的 存储 设 
备 ( 壁 如 磁盘 或 磁带 ) 的 通用 功能 。 在 其 下 一 层 是 存储 端口 驱动 程序 ， 其 承担 了 诸如 小 型 计 
算 机 系统 接口 《Small Computer System Interface，SCSI) 或 高 技术 连接 系统 接口 (Advanced 
Technology Attachment，ATA ， 或 称 为 高 技术 附加 装置 ) 等 特定 总 线 的 通用 功能 。 磁 盘 驱 动 
器 供应 商 往往 会 提供 微型 端口 驱动 程序 ， 以 支持 特定 设备 或 系列 兼容 设备 。 存 储 类 驱动 程 
序 具 有 与 设备 驱动 程序 接口 相同 的 应 用 程序 接口 。 而 微型 端口 驱动 程序 使 用 端口 驱动 程序 接 
口 ， 而 不 是 设备 驱动 程序 接口 。 这 种 方法 简化 了 微型 端口 开发 人 员 的 工作 ， 因 为 它们 具有 与 
以 往 微软 操作 系统 相 兼容 的 应 用 程序 接口 。 存 储 类 驱动 程序 通常 可 以 管理 和 操纵 相应 存储 类 
中 的 许多 设备 ， 而 无 须 存 储 端口 驱动 程序 或 微型 端口 驱动 程序 。 最 典型 的 例子 就 是 一 般 的 通 
用 串 行 总 线 存 储 类 驱动 程序 ， 该 驱动 程序 可 以 在 没有 任何 其 他 驱动 程序 的 前 提 下 访问 许多 通 
用 叮 行 总 线 存储 设备 。 


18.7 图 形 化 用 户 接口 编程 


诚然 ， 对 于 用 户 来 说 ，Windows 操作 系统 的 定义 的 特性 就 是 图 形 化 用 户 界 面 。 程 序 设 
计 人 员 通 过 Windows 操作 系统 的 应 用 程序 接口 来 访问 那些 操纵 桌面 上 相关 对 象 的 操作 系统 
函数 。 有 关 接 口 为 编程 人 员 提 供 了 绘制 窗口 以 及 制作 菜单 和 对 话 框 等 一 系列 功能 。 操 作 系 统 
本 身 负责 通用 功能 ， 例 如 确保 当 一 个 窗口 关闭 时 ， 该 被 关闭 窗口 后 面 的 相应 窗口 的 适当 部 分 
被 刷新 。 同 时 ， 操 作 系统 还 为 程序 设计 人 员 提 供 了 通用 对 话 框 等 设施 。 如 图 18-9 所 示 ， 该 
图 显示 了 一 个 标准 的 基于 窗口 的 对 话 框 ， 而 有 关 程 序 可 以 使 用 该 对 话 框 来 查找 要 打开 的 一 个 
文件 (或 多 个 文件 )、 指 定 要 保存 的 文件 的 名 称 、 选 择 字体 或 颜色 以 及 任何 程序 可 能 需要 支 
持 的 其 他 常见 功能 。 应 用 程序 编程 人 员 可 以 使 用 这 一 界面 ， 但 并 不 是 必须 要 这 样 做 才 行 。 如 
果 使 用 这 一 界面 ， 那 么 不 同 的 应 用 程序 均 会 呈现 出 相似 的 外 观 和 感觉 。 当 程序 设计 人 员 开 发 
完成 了 更 为 复杂 精致 的 界面 时 ， 他 们 往往 倾向 于 使 用 那些 复杂 精致 的 界面 来 代替 这 种 标准 界 


366 沛 信 页 分 实例 研 项 


面 。 有 人 可 能 认为 ， 这 些 新 的 界面 对 用 户 更 加 友好 或 者 更 适合 于 给 定 的 任务 。 但 是 ， 如 果 每 
个 应 用 程序 都 有 一 套 不 同 的 界面 ， 那 么 就 有 可 能 使 得 整个 系统 对 于 初学 者 来 说 更 加 难以 掌 
握 。 因 此 ， 尚 无 法 确定 ， 这 种 权衡 是 否 真 的 总 有 必要 的 。 





图 18-9 “文件 打开 ”对 话 框 


18.8 网络 


有 关 设 计 开 发 人 员 希 望 NT 操作 系统 能 与 其 他 操作 系统 保持 兼容 的 男 一 方面 是 其 所 支 
持 的 网 络 协议 。 在 NT 操作 系统 开发 时 ， 互 联网 在 学 术 界 已 经 相当 流行 ， 但 是 在 互联 网 中 
所 使 用 的 传输 控制 协议 和 网 际 协议 还 没有 成 为 像 今 天 这 样 的 占 主导 地 位 的 网 络 协议 。 当 时 ， 
Novell Netware 操作 系统 是 主要 的 个 人 计算 机 文件 服务 器 平台 ， 而 且 其 拥有 自己 的 协议 ， 即 
互联 网 数据 包 交 换 ( Internet Packet Exchange，IPX) 协议 和 序列 数据 包 交 换 (Sequenced 
Packet Exchange，SPX) 协议 。 与 此 同时 ,还 有 许多 UNIX 系统 在 运转 着 。 另 外 ,许多 较 大 
型 的 企业 则 拥有 IBM 公司 的 大 型 主机 ( mainframe) 和 中 端 系统 (midrange system)， 而 这 些 
系统 中 采用 的 则 是 IBM 协议 。 来 自 苹 果 公 司 的 系统 则 在 各 种 各 样 的 硬件 拓扑 结构 上 部 署 运 
行 了 称 为 苹果 对 话 (AppleTalk) 的 协议 。 为 了 在 使 用 上 述 其 他 系统 的 客户 的 网 络 中 占有 一 
席 之 地 ， 微 软 必 须 得 安装 得 力 的 网 络 支撑 系统 ， 且 该 系统 可 以 通过 支持 上 述 系 统 所 采用 的 协 
议 从 而 实现 与 相关 系统 之 间 的 方便 的 通信 。 当 然 ，NT 操作 系统 还 必须 要 提供 与 早期 版 本 的 
Windows 和 DOS 操作 系统 所 采用 协议 的 兼容 性 。 因 此 ，NT 操作 系统 包含 了 相关 这 些 系统 
所 使 用 的 所 有 标准 协议 。( 这 些 协议 有 时 对 多 个 系统 是 共用 的 一 一 例如 ，VAX 系统 也 常常 采 
用 传输 控制 协议 和 网 际 协议 )。 相 关 典 型 协议 包括 : 

e Novell Netware 所 采用 的 互联 网 数据 包 交 换 协议 和 序列 数据 包 交 换 协 议 

e UNIX 所 采用 的 传输 控制 协议 和 网 际 协议 

e 数字 设备 ( Digital Equipment) 公司 VAX 系统 所 采用 的 数字 设备 公司 分 层 网 络 体系 

结构 协议 (Digital Equipment Corporation network，DECNet) 
e IBM 系统 所 采用 的 系统 网 络 体系 结构 ( System Network Architecture，SNA) 协议 和 网 
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络 基 本 输入 /输出 系统 增强 型 用 户 接口 (NetBIOS Enhanced User Interface, NetBEUI) 
协议 

e 传统 Windows 操作 系统 所 采用 的 局 域 网 管理 器 (LAN Manager) 协议 

与 NT 操作 系统 的 大 多 数 其 他 主要 组 件 相 类 似 ， 其 网 络 功能 也 进行 了 分 层 处 理 。 例 如 ， 
网 络 栈 ( networking stack) 的 最 底层 采用 了 由 微软 公司 和 3Com 公司 所 定义 的 称 为 网 络 驱动 
程序 接口 规范 (Network Driver Interface Specification，NDIS) 的 接口 。 该 接口 是 为 允许 单个 硬 
件 设备 驱动 程序 支持 多 个 网 络 层 协议 而 专门 设计 的 。 于 是 ， 网 络 接口 卡 ( network interface 
card，NIC ; 或 简称 网 卡 ) 的 供应 商 就 可 以 为 网 卡 和 硬件 平台 的 每 个 组 合 编写 一 个 单独 的 驱 
动 程序 ， 而 不 用 考虑 具体 的 操作 系统 或 网 络 层 软件 。 实 际 上 ， 这 便 允 许 有 关 驱 动 程序 同时 支 
持 多 个 网 络 层 协议 。 与 输入 /输出 系统 一 样 ， 这 种 层次 式 体 系 结构 允许 透明 地 插入 大 多 数 用 
户 并 不 需要 的 额外 的 功能 。 一 个 例子 是 ， 通过 在 个 人 计算 机 系统 中 插入 提供 简单 网 络 管理 协 
议 (Simple Network Management Protocol，SNMP) 功能 的 层级 ， 就 能 够 利用 基于 简单 网 络 
管理 协议 的 网 络 管理 控制 台 对 相应 的 个 人 计算 机 实施 远程 监控 。 该 协议 曾经 在 第 15 章 中 进 
行 过 讨论 。 而 在 此 类 监控 没有 需要 的 情况 下 ， 也 不 用 非得 要 把 相应 功能 安装 到 系统 上 和 造成 
资源 的 无 端 浪费 。 

NT 操作 系统 网 络 支 持 的 一 个 很 有 意思 的 特性 是 其 包含 有 一 个 面向 异步 传输 模式 
( Asynchronous Transfer Mode，ATM) 硬件 的 接口 。 异 步 传输 模式 拥有 若 于 有 趣 的 特征 ， 但 
却 被 大 多 数 人 在 其 匆忙 加 入 以 太 网 浪潮 的 过 程 中 给 忽略 了 。 首 先 ， 网 际 协议 的 最 大 帧 大 小 是 
64KB， 同 以 太 网 1500 字 节 的 最 大 帧 大 小 相 比 ， 异 步 传输 模式 64KB 的 最 大 帧 大 小 与 网 际 协 
议 的 最 大 帧 大 小 更 为 吻合 ， 也 更 适合 。 特 别 地 ， 当 硬件 可 以 直接 支持 较 大 型 的 数据 块 时 ， 却 
非得 要 把 它们 划分 成 小 型 的 数据 块 ， 这 无 疑 是 对 资源 的 极 大 浪费 。 另 一 方面 ， 异 步 传 输 模 
式 不 用 求助 于 特别 的 软件 模块 和 额外 的 软件 层 ， 就 能 够 支持 硬件 中 的 服务 质量 ( Quality of 
Service，QoS ) 特性 。 随 着 多 媒体 应 用 变 得 越 来 越 为 重要 ， 一 些 人 已 经 发 现 相 关 应 用 系统 在 
异步 传输 模式 上 要 比 在 以 太 网 上 工作 得 更 好 ， 为 此 ，NT 操作 系统 已 经 包含 了 对 相关 功能 的 
支持 。 


18.9 对 称 多 处 理 


支持 NT 系列 操作 系统 的 硬件 平台 可 扩展 到 非常 大 型 的 系统 。 而 拥有 多 处 理 器 则 是 在 那 
些 被 设计 用 来 支持 大 容量 服务 器 的 系统 中 经 常 可 以 发 现 的 一 项 特征 。 目 前 ， 多 处 理 器 技术 正 
在 向 下 迁移 ， 并 开始 进入 普通 的 桌面 系统 ， 相 关 桌 面 系统 带 有 能 够 并 发 运行 多 个 进程 的 处 理 
器 ， 而 且 单 块 芯片 中 包含 有 多 个 处 理 器 。NT 操作 系统 支持 曾 在 第 6 章 和 第 9 章 讨 论 过 的 对 
称 多 处 理 (Symmetric Multi Processing，SMP) 系统 。NT 系列 操作 系统 支持 的 最 大 处 理 器 数 
量 随 处 理 器 字 的 大 小 而 相应 变化 ， 进 一 步 说 ，32 位 处 理 器 最 多 支持 32 个 处 理 器 ， 而 64 位 
处 理 器 最 多 支持 64 个 处 理 器 。 之 所 以 存在 这 样 的 限制 关系 ， 只 是 因为 关于 各 个 处 理 融 的 掩 
码 是 被 存储 在 单个 数据 字 中 的 。 


18.10 ”XP 操作 系统 启动 速度 提升 措施 


XP 版 操作 系统 的 一 项 令 人 关注 的 设计 目标 是 加 快 引导 操作 系统 的 速度 及 减少 启动 时 间 。 
这 一 目标 在 一 定 程 度 上 取决 于 系统 启动 的 方式 。 对 于 冷 启动 ( cold start) 来 说 ， 有 关 目 标 即 
启动 时 间 期 望 值 无 疑 比 从 待机 模式 ( standby mode) 或 休眠 模式 (hibernate mode) 所 需 的 启 
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动 时 间 要 长 得 多 。 进 一 步 说 ， 从 待机 状态 重新 启动 ，5 秒 的 启动 时 间 就 是 目标 值 。 请 注意 ， 
这 需要 启用 一 个 称 为 高 级 配置 电源 接口 (Advanced Configuration Power Interface，ACPI) 的 
硬件 选项 。 这 项 目标 的 时 间 间 隔 很 有 意思 ， 因 为 它 大 致 是 人 类 短期 记忆 的 超时 限 值 。 如 果 你 
开始 执行 某 项 任务 ， 并 且 启 动 该 项 任务 所 需 的 操作 大 约 需要 7 秒 钟 以 上 ， 那么 你 会 经 常 发 
现 ， 执 行 伊始 ， 你 的 注意 力 却 已 经 开小差 了 一 一例 如 ， 你 可 能 忘掉 了 你 刚刚 查找 过 的 电话 号 
码 。 因 此 ， 如 果 你 的 个 人 计算 机 处 于 关机 状态 ， 而 你 决定 打开 它 来 查找 某 些 有 趣 的 东西 ， 且 
如 果 它 的 启动 需要 7 秒 多 的 时 间 ， 那 么 你 可 能 会 发 现 ， 你 曾经 内 出 的 好 的 想法 刚才 却 悄 悄 地 
汐 走 了 。 所 以 这 是 一 项 非常 重要 的 功能 ， 尽 管 许多 用 户 对 此 可 能 并 不 完全 理解 ， 但 这 项 功能 
却 的 的 确 确 在 影响 着 他 们 。 





18.11 小 结 
在 本 章 中 ,我 们 讨论 了 一 种 比较 高 级 的 操作 系统 一 一 微软 公司 开发 的 Windows NT 操作 
系统 的 有 关 功 能 和 概念 。 首 先 ， 我 们 对 NT 操作 系统 进行 了 概述 ， 并 简要 介绍 了 微软 操作 系 


统 的 发 展 历程 。 然 后 ， 我 们 扼要 地 就 高 端 单 用 户 操作 系统 的 性 质 以 及 NT 系列 操作 系统 的 主 
要 目标 一 对 源 自传 统 操作 系统 的 应 用 程序 的 支持 以 及 对 多 种 硬件 平台 的 支持 一 进行 了 论 
述 。 接 下 来 ,我们 讨论 了 同时 运行 多 用 户 应 用 程序 和 服务 器 应 用 程序 所 带 来 的 复杂 性 。 需 要 
强调 的 是 ， 这 种 新 增 的 复杂 性 在 NT 系列 操作 系统 所 支持 的 无 论 进程 和 线程 的 调度 还 是 额外 
的 存储 器 管理 功能 中 都 有 所 体现 。 

在 此 基础 上 ， 我 们 概要 阐明 了 NT 操作 系统 中 的 文件 支持 、 在 有 关系 统 上 配置 多 个 用 户 
以 及 多 个 服务 器 所 需 的 更 高 级 别 的 功能 ， 我 们 同时 还 讨论 了 有 关 操作 系统 所 提供 的 输入 / 输 
出 功能 的 范畴 。 其 后 ， 我 们 简要 阐述 了 由 于 同时 打开 多 个 窗口 而 导致 的 图 形 化 用 户 界 面 功能 
的 一 些 新 的 考量 ， 另 外 我 们 还 提 到 了 NT 操作 系统 下 的 多 处 理 器 支持 的 话题 。 最 后 ， 我 们 控 
讨 了 XP 操作 系统 的 启动 速度 。 

在 下 一 章 中 ,我 们 将 会 围绕 Linux 操作 系统 展开 进一步 的 实例 研究 ， 主 要 涵盖 那些 没有 
在 螺旋 式 教学 章节 所 涉及 的 功能 特征 ， 重 点 是 支持 多 用 户 所 需 的 相关 功能 。 
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当 开 发 Windows NT 操作 系统 的 时 候 ， 主 要 发 生 了 什么 样 的 变化 ， 使 得 其 不 同 于 微软 以 往 大 多 
数 的 操作 系统 产品 ? 
本 章 提 到 的 关于 XP 系列 操作 系统 的 一 些 主要 目标 都 有 什么 ? 
当 一 个 进程 执行 fork 调用 时 ，XP 操作 系统 并 不 会 真正 创建 相应 程序 的 第 二 个 副本 。 那 么 它 做 了 
什么 呢 ? 
如 何 解决 硬件 独立 性 的 目标 ? 
NT 操作 系统 使 用 什么 类 型 的 对 象 来 调度 处 理 器 呢 ? 
请 描述 普通 优先 级 类 别 和 实时 优先 级 类 别 之 间 的 区 别 。 
关于 NTFS 对 文件 中 的 数据 的 支持 方案 ， 有 什么 不 同 寻常 的 地 方 ? 特别 地 ， 如 果 有 关 数 据 非常 
短小 ， 会 发 生 什么 呢 ? 
Windows XP 操作 系统 是 否 支持 OS/2 HPFS 文件 系统 ? 
NT 操作 系统 采用 软件 方式 支持 了 哪些 廉价 磁盘 元 余 阵 列 构 型 ? 
为 什么 在 输入 / 输出 系统 和 文件 系统 之 间 进 行 这 样 一 个 明确 的 划分 非常 重要 ? 
NT 操作 系统 支持 压缩 文件 甚至 文件 系统 的 整个 部 分 。 这 是 否 正确 ? 
“基于 日 志 ” 的 文件 系统 的 影响 是 什么 ? 
可 动态 安装 的 设备 驱动 程序 的 优点 是 什么 ? 
Windows XP 操作 系统 的 命令 行 界面 有 什么 不 寻常 的 地 方 ? 
有 一 派 观点 认为 ， 应 用 程序 在 其 图 形 化 用 户 界 面 中 使 用 标准 要 素 更 为 合适 。 而 另 一 派 观点 则 认 
为 ,改进 的 要 素 能 够 让 应 用 程序 变 得 更 好 。 请 论证 你 自己 的 选择 。 
为 什么 XP 操作 系统 支持 异步 传输 模式 协议 栈 ? 
网 络 驱动 程序 接口 规范 是 做 什么 的 ? 
XP 操作 系统 支持 哪 种 多 处 理 机 制 ? 


第 19 章 | 


Operating Systems: A Spiral Approach 


Linux 操作 系统 实例 研究 





在 本 书 的 第 二 部 分 ， 我 们 曾经 讨论 过 Linux 操作 系统 的 一 些 基本 特征 以 及 多 用 户 设计 对 
操作 系统 提出 的 一 些 特别 需求 。 在 相应 章节 ， 我 们 还 概要 介绍 了 Linux 及 其 历史 背景 ， 并 讨 
论 了 多 用 户 操 作 系 统 的 一 般 特性 、Linux 操作 系统 中 的 进程 和 进程 调度 以 及 用 户 登 录 的 本 质 
和 文件 保护 机 制 。 

”在 本 章 中 ,我们 将 从 操作 系统 实例 研究 的 角度 进一步 前 述 Linux 的 更 多 信息 ， 并 诠释 其 
是 如 何 实现 那些 我 们 期 望 在 任何 现代 操作 系统 中 所 看 到 的 标准 功能 的 。 本 章 着 眼 于 与 第 6 章 
相关 素材 的 互相 补充 和 完善 ， 故 而 尽量 避免 不 必要 的 内 容重 复 。 在 本 章 的 开始 部 分 ， 我 们 将 
首先 简要 回顾 一 下 Linux 及 其 发 展 历程 。 接 下 来 ， 我 们 在 第 19.2 节 将 讨论 Linux 操作 系统 
的 进程 调度 。 在 此 基础 上 ， 我 们 将 在 第 19.3 节 进 一 步 讨 论 支持 在 许多 不 同 进程 上 工作 的 诸 
多 用 户 所 需 的 内 存 管理 特性 。 第 19.4 节 则 主要 介绍 Linux 操作 系统 中 的 文件 组 织 ， 特 别 地 ， 
鉴于 Linux 操作 系统 独特 的 发 展 历程 ， 所 以 其 支持 许多 不 同 的 文件 系统 。 在 第 19.5 节 ， 我 
们 将 盖 明 Linux 操作 系统 提供 的 基本 输入 /输出 功能 ， 而 在 第 19.6 节 ， 将 对 源 自 于 UNIX 所 
使 用 的 相关 设计 的 图 形 化 用 户 接口 编程 支持 展开 论述 。 其 后 ， 我 们 在 第 19.7 节 将 讨论 Linux 
系统 中 的 网 络 支持 ， 就 像 文件 系统 一 样 ， 由 于 Linux 的 演化 过 程 及 其 必须 共存 的 现实 环境 ， 
所 以 相关 支持 也 较为 复杂 。 在 第 19.8 节 ， 我 们 探讨 Linux 系统 的 一 些 特殊 安全 考量 ， 在 第 
19.9 节 则 讨论 Linux 系统 在 支持 多 处 理 器 方面 所 遇 到 的 问题 ， 而 在 第 19.10 节 则 主要 涵盖 
Linux 操作 系统 的 硬 实 时 操作 系统 变种 和 奶 人 式 操作 系统 变种 。 最 后 ， 我 们 在 第 19.11 节 对 
全 章 内 容 进行 归纳 总 结 。 


19.1 引言 


19.1.1 Linux 发 展 简 史 


Linux 操作 系统 在 很 大 程度 上 是 以 UNIX 一 一 一 种 诞生 更 早 、 支 持 多 个 用 户 通过 连接 到 
大 型 计算 机 的 终端 来 使 用 计算 机 的 操作 系统 一 一 为 导向 的 。 现 在 ， 有 些 版 本 的 Linux 被 用 作 
单 用 户 的 个 人 计算 机 上 的 操作 系统 ， 尽 管 这 些 版 本 仍然 保持 着 多 用 户 机 制 的 内 部 结构 。 实 际 
上 ， 单个 用 户 可 能 运行 多 个 虚拟 终端 ， 并 且 可 能 在 它们 之 间 进 行 切 换 ， 就 像 系 统 上 有 多 个 用 
户 一 样 ， 同 时 有 关系 统 还 可 以 支持 来 自 远程 连接 的 相关 用 户 的 并 发 会 话 。 而 某 些 其 他 版 本 的 
Linux 操作 系统 的 目的 则 在 于 纯粹 作为 远程 的 服务 器 ， 承 担 各 种 各 样 的 功能 ， 譬 如， 用 作 网 
络 中 的 路 由 器 、 用 来 控制 实时 系统 以 及 嵌入 没有 人 机 接口 的 设备 中 等 。 正 如 前 面 在 第 6 章 中 
所 指出 的 那样 ，Linux 是 以 生产 版 本 和 开发 版 本 的 方式 发 布 的 ， 而 本 章 中 所 描述 的 功能 特征 
主要 与 2.6 版 内 核 有 关 。 

Linux 操作 系统 的 历史 比 许多 其 他 的 操作 系统 要 短 ， 以 下 是 其 比较 重要 的 版 本 和 功能 的 
简短 总 结 : 

e V.1.0，1994 年 3 月 ， 仅 支持 单 处 理 器 i386 机 器 。 

e V. 1.2，1995 年 3 月 ， 增 加 了 对 Alpha (阿尔 法 )、SPARC (斯 巴克 ) 和 MIPS 处 理 器 
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的 支持 。 
V. 2.0，1996 年 6 月 ,增加 了 对 更 多 型 号 的 处 理 器 及 对 称 多 处 理 系统 的 支持 。 
e V.2.2，1999 年 1 月 。 
e V.2.4.0，2001 年 1 月 。 
到 惠普 (Hewlett-Packard，HP) 公司 的 PA-RISC 处 理 右 。 
和 安 讯 士 (Axis Communications) 公司 的 ETRAX CRIS 处 理 器 。 
里 企业 标准 架构 即 插 即 用 ( ISA Plug-and-Play)、 通 用 串 行 总 线 ( Universal Serial Bus， 
USB) 架构 、PC 卡 和 蓝牙 (Bluetooth ) 。 
廉价 磁盘 元 余 阵 列 设备 。 
e V.2.6, 2003 年 12 月 17 日 。 
和 uClinux (一 种 共和 式 Linux 操作 系统 ， 用 于 没有 分 页 式 内 存 管理 部 件 的 机 器 ) 。 
加 日 立 (Hitachi) 公司 的 H8/300 系列 处 理 器 、NEC 公司 的 v850 处 理 器 、 摩 托 罗 拉 
公司 的 嵌入 式 m68k 处 理 器 。 
得 英特尔 公司 的 超 线程 和 物理 地 址 扩展 (Physical Address Extension ， PAE)。 
里 (每 个 系统 的 ) 最 多 用 户 数 和 组 数 可 达 4 294 967 296。 
外 进程 标识 符 的 最 大 数目 可 达 1 073 741 824。 
至 文件 系统 最 高 可 达 16TB。 
至 无 限 带 宽 (infiniband) 支持 。 


19.1.2 内核 体 系 结构 


Linux 内 核 结构 非常 庞大 ， 但 同时 也 是 高 度 模块 化 的 ， 允 许 个 别 子 系统 非常 方便 地 被 实 
验 版 本 所 替换 。 不 过 ， 各 个 模块 之 间 的 关系 错综复杂 。 事 实 上 ， 几 乎 没有 什么 模块 不 以 某 种 
方式 与 大 多 数 的 其 他 主要 模块 发 生 交互 。 图 19-1 显示 了 一 些 主要 组 件 以 及 相关 模块 之 间 的 
最 重要 的 关系 。 在 本 章 的 后 续 部 分 ， 我 们 将 就 一 些 主要 系统 模块 的 有 关机 制 展开 讨论 。 





图 19-1 Linux 系统 体系 结构 
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19.2 ”进程 调度 

在 Linux 内 核 2.6 中 对 进程 调度 模块 (process scheduler module) 进行 了 重新 设计 ， 其 目 
的 在 于 构建 一 个 采用 O(1) 级 时 间 复 杂 度 算法 的 调度 器 。 在 先前 的 内 核 版 本 中 所 用 调度 器 的 
时 间 复 杂 度 是 O(n)， 当 系统 负载 很 高 的 情况 下 运行 状况 表现 欠 佳 。 进 程 调 度 模块 ( SCHED) 
负责 选 定 应 当 由 哪个 进程 来 访问 处 理 器 。Linux 文档 通常 使 用 术语 “任务 ”而 不 是 “进程 ”， 
但 对 于 大 多 数 情 况 而 言 ， 我 们 可 以 认为 二 者 是 等 同 的 。Linux 使 用 基于 优先 级 的 调度 算法 ， 
从 系统 中 的 可 运行 进程 中 进行 选择 。( 可 运行 进程 就 是 等 待 使 用 处 理 器 和 要 运行 的 进程 。) 

具体 而 言 ，Linux 系统 设立 有 一 个 运行 队列 (runqueue) 由 140 个 列表 组 成 ， 且 每 个 优 
先 级 一 个 列表 ， 相 关 示 例如 图 19-2 所 示 。( 在 多 处 理 器 系统 中 ， 对 于 每 个 处 理 器 而 言 ， 往 
往 都 各 自 存 在 一 个 类 似 的 结构 ， 不 过 现在 我 们 将 忽略 这 一 点 。) 同时 设 定 ， 每 个 列表 按 先进 
先 出 次 序 进行 扫描 ， 且 即将 被 调度 执行 的 进程 添加 到 运行 队列 中 其 相应 优先 级 列表 的 末尾 。 
大 多 数 进程 均 拥有 一 个 时 间 片 (time slice 或 quantum)， 以 限制 它们 可 以 运行 的 时 间 。 故 
而 ， 有 关 调 度 算法 为 找到 一 个 进程 (以 调度 运行 ) 所 花费 的 时 间 并 不 取决 于 有 效 进程 (active 
process， 或 称 为 活动 进程 ) 的 数量 ， 而 是 取决 于 优先 级 列表 (priority list) 的 数量 。 


-=---------- 十 








图 19-2 ”有 效 运行 队列 


在 这 里 ， 我 们 所 讨论 的 运行 队列 ， 准 确 地 讲 应 称 为 有 效 运行 队列 〈active runqueue， 或 
称 为 活动 运行 队列 )。 除 了 这 个 队列 以 外 ， 还 有 一 个 所 谓 的 失效 运行 队列 (expired runqueue， 
或 称 为 过 期 运行 队列 )。 当 有 效 运行 队列 的 一 个 进程 使 用 完 它 的 时 间 片 的 时 候 ， 该 进程 将 会 
被 移动 到 失效 运行 队列 ， 同 时 ， 会 重新 计算 它 的 下 一 个 时 间 片 和 优先 级 。 如 果 在 有 效 运行 队 
列 上 已 没有 进程 ， 那 么 应 对 换 指 向 有 效 运行 队列 和 失效 运行 队列 的 指针 值 ， 以 使 失效 运行 队 
列 转变 成 为 有 效 运 行 队列 。 在 这 时 候 ， 所 有 的 进程 都 将 拥有 一 个 新 的 时 间 片 。 另 外 ， 规 定 
调度 期 (scheduling epoch， 或 称 为 调度 时 期 ) 是 指 从 所 有 可 运行 进程 开始 拥有 一 个 新 的 时 间 
片 , 一 直到 所 有 可 运行 进程 用 完 其 时 间 片 并 且 有 效 运 行 队列 和 失效 运行 队列 需要 进行 对 换 时 
之 间 的 时 间 。 

调度 器 总 是 调度 系统 上 最 高 优先 级 的 进程 。 如 果 同 一 优先 级 存在 多 个 进程 ， 那 么 将 按照 
轮转 ( round-robin) 方式 来 进行 调度 。 有 关 的 运行 队列 结构 不 仅 使 得 最 高 优先 级 进程 的 查找 
成 为 时 间 恒 定 ( constant-time) 的 操作 ， 而 且 还 使 得 优先 级 内 的 轮转 查找 也 可 能 是 时 间 恒 定 
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的 。 还 有 ， 拥 有 两 个 运行 队列 使 得 时 间 片 调度 期 之 间 的 变迁 也 成 为 一 个 时 间 恒 定 的 操作 。 


19.2.1 实时 进程 


标准 的 Linux 调度 器 提供 了 软 实时 (soft real-time) 调度 支持 ， 这 意味 着 ， 尽 管 该 调度 器 
可 以 很 好 地 满足 调度 截止 时 间 ( scheduling deadline) 要 求 ， 但 却 不 能 保证 有 关 截 止 时 间 一 定 
得 到 满足 。 进 一 步 说 ， 该 调度 器 采用 了 两 种 不 同 的 调度 类 别 ， 以 确保 所 有 进程 可 以 对 处 理 器 
进行 公平 的 访问 ， 同 时 确保 由 内 核 所 执行 的 必要 的 硬件 操作 能 够 按时 完成 。 为 此 ，Linux 操 
作 系 统 把 进程 划分 成 了 两 类 ， 即 普通 进程 (normal process) 和 实时 进程 (real-time process ) 。 
具体 而 言 ， 有 关 运 行 队列 的 前 100 个 优先 级 列表 是 为 实时 进程 保留 的 ， 而 最 后 40 个 优先 级 
列表 则 可 为 用 户 进程 所 使 用 。 由 于 实时 进程 的 优先 级 数值 低 于 非 实时 进程 ， 所 以 它们 总 是 会 
在 非 实时 进程 之 前 运行 。( 这 可 能 有 点 令 人 困惑 ， 因 为 “ 较 低 ”的 优先 级 数值 却 拥有 一 个 意 
味 着 将 会 首先 运行 的 “ 较 高 ”的 优先 级 ， 不 过 ，Linux 文档 确实 就 是 这 样 描 述 的 。) 只 要 实时 
进程 是 可 运行 的 ， 那么 普通 进程 就 不 会 运行 。 实 时 进程 采用 两 种 调度 方案 来 进行 调度 ， 即 先 
进 先 出 (FIFO， 对 应 于 宏 常量 SCHED_FIFO) 和 轮转 (round robin， 对 应 于 宏 常量 SCHED_ 
RR)。 需 要 作为 实时 进程 运行 的 进程 往往 会 使 用 系统 调用 来 告知 操作 系统 应 选用 哪 种 调度 
器 。 而 如 果 有 关 进 程 没有 执行 这 样 的 系统 调用 ， 那么 对 应 进程 将 会 是 一 个 普通 进程 ， 具 体 在 
下 一 小 节 展 开 讨 论 。 

先进 先 出 进程 按照 先进 先 出 的 方式 进行 调度 。 如 果 有 一 个 先进 先 出 进程 已 准备 好 要 在 系 
统 上 运行 ,那么 它 将 会 抢占 处 理 器 和 取代 任何 优先 级 数值 更 大 的 其 他 进程 ， 并 且 ， 只 要 该 先 
进 先 出 进程 需要 在 系统 上 运行 ， 那 么 它 便 会 继续 运行 ， 因 为 对 先进 先 出 进程 没有 时 间 限 制 。 
换 句 话说 ， 多 个 先进 先 出 进程 按照 优先 级 来 进行 调度 ， 并 且 优 先 级 数值 较 小 的 先进 先 出 进程 
将 会 抢占 优先 级 数值 较 大 的 先进 先 出 进程 所 占有 的 处 理 器 。 对 于 轮转 式 进程 而 言 ， 除 了 具有 
时 间 片 限制 以 及 它们 所 占有 的 处 理 器 往往 会 被 先进 先 出 过 程 抢占 之 外 ， 它 们 与 先进 先 出 进程 
是 完全 一 样 的 。 在 给 定 的 优先 级 别 上 ， 轮 转 式 进 程 以 轮转 方式 进行 调度 。 当 每 个 轮转 式 进 程 
运行 完 为 其 分 配 的 时 间 片 时 ， 将 会 返回 到 其 所 在 运行 队列 中 相应 优先 级 列表 的 末尾 。 


19.2.2 普通 进程 


非 实时 进程 被 标记 为 SCHED_NORMAL (以 前 称 为 SCHED_ OTHER) 一 一 默认 的 调度 类 
别 。 为 了 防止 某 个 进程 一 直 占 用 处 理 器 ， 而 使 其 他 也 需要 访问 处 理 器 的 进程 陷入 饥饿 状态 ， 
Linux 调度 器 可 以 动态 地 改变 有 关 进 程 的 优先 级 ， 具 体 通过 提高 计算 密集 型 ( CPU-bound) 
进程 的 优先 级 数 (从 而 降低 其 优先 级 ) 和 降低 输入 /输出 密集 型 (1/0-bound) 进程 的 优先 级 
数 的 方法 来 加 以 实现 。 通 常情 况 下 ， 输 入 /输出 密集 型 进程 使 用 处 理 器 来 设置 和 启动 一 项 输 
入 /输出 操作 ， 然 后 就 去 等 待 相应 输入 /输出 完成 。 而 当 进 程 在 等 待 输入 /输出 操作 的 同时 ， 
其 他 的 进程 便 可 以 访问 处 理 器 。 另 外 ， 与 用 户 通信 的 进程 往往 会 执行 大 量 的 输入 /输出 操 
作 ， 故 而 被 赋予 比 非 交 互 式 进程 (noninteractive process) 更 高 的 优先 级 ， 从 而 获得 更 好 的 交 
互 式 响 应 效果 。 

输入 /输出 密集 型 进程 的 优先 级 数 最 多 可 以 减少 5 个 优先 级 别 ， 而 计算 密集 型 进程 的 优 
先 级 数 则 至 多 可 以 增加 5 个 优先 级 别 。 进 一 步 说 ， 进 程 将 会 根据 关于 其 交互 性 的 启发 式 计算 
结果 来 确定 是 输入 /输出 密集 型 进程 还 是 计算 密集 型 进程 。 而 进程 的 交互 性 (interactiveness ) 
则 要 根据 进程 运行 时 间 与 其 休眠 时 间 的 比较 来 进行 推算 。 一 般 而 言 ， 计 算 比 典型 的 输入 / 输 
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出 操作 要 快 得 多 。 鉴 于 输入 /输出 密集 型 进程 请 求 输入 /输出 操作 之 后 ， 接 下 来 就 会 去 等 待 
输入 /输出 操作 完成 ， 所 以 输入 /输出 密集 型 进程 往往 会 比 计算 密集 型 进程 花费 更 多 的 时 间 
来 等 待 ， 也 就 是 说 ， 休 眠 时 间 较 运行 时 间 长 的 进程 具有 较 强 的 交互 性 ， 并 可 认定 为 输入 / 输 
出 密集 型 进程 ; 反之 ,休眠 时 间 较 运行 时 间 不 占 优势 的 进程 的 交互 性 不 强 ， 并 可 认定 为 计算 


19.2.3 nice 命令 及 相关 系统 调用 

有 时 会 希望 以 不 同 于 普通 默认 级 别 的 优先 级 来 运行 一 道 程序 。 例 如 ， 程 序 有 可 能 提供 了 
一 项 比 交 互 式 用 户 功能 的 优先 级 要 低 的 后 人 台 功 能 ( background function)。 相 反 ， 进 程 可 能 正 
在 运行 ， 且 需要 比 正常 情况 更 高 的 优先 级 。 总 的 来 说 ， 有 两 种 方法 可 以 改变 程序 的 优先 级 。 
首先 ， 用户 可 以 使 用 nice 命令 来 运行 一 道 普 通 级 别 之 外 的 优先 级 的 程序 ， 其 次 ， 程 序 可 以 
在 运行 时 通过 系统 调用 来 改变 自己 的 优先 级 。 关 于 nice 命令 ， 原 先 的 设想 是 用 户 可 以 自由 
地 以 较 高 优先 级 数 ( 故 而 具有 较 低 的 优先 级 ) 来 运行 一 条 命令 。nice 命令 具体 用 法 如 下 所 述 : 


nice [-n increment]... [Command [argument]...] 


-n increment : increment 表示 优先 级 数 增 量 ， 取 值 应 当 在 1 一 19。 如 果 没 有 指定 ， 则 自 
动 设 定 优先 级 数 增 量 为 10。 若 increment 大 于 19， 则 优先 级 数 增 量 将 被 自动 修正 为 19。 另 
外 ， 有 具有 管理 员 权限 的 用 户 可 以 通过 使 用 负 增 量 ， 璧 如 -10, 来 使 命令 以 高 于 正常 状况 的 优 
先 级 运行 。 

command: 要 调用 的 命令 的 名 称 。 

argument: 调用 命令 时 用 作 参 数 的 字符 串 。 

另外 ， 进 程 也 可 以 通过 调用 诸如 sched_setparam 之 类 的 操作 系统 函数 来 更 改 其 自身 的 
优先 级 ， 这 里 的 sched_setparam 是 一 个 可 移植 操作 系统 接口 (POSIX) 标准 的 函数 。 当 然 ， 
也 可 以 使 用 其 他 的 操作 系统 调用 。 在 下 面 给 定 的 示例 中 ，sched_setparam 用 来 设置 与 由 pid 
所 标识 的 进程 的 调度 策略 相关 联 的 调度 参数 ， 而 参数 p 的 解释 取决 于 所 选 定 的 策略 。 如 上 
所 述 ， 在 Linux 系统 中 支持 如 下 三 种 调度 策略 : SCHED_FIFO、SCHED RR 和 SCHED_ 
NORMAL。 


#include <sched.h> 
int sched setparam (pid t pid, const struct sched param *p); 


struct sched param { 
int 
}; 
19.2.4 ”对 称 多 处 理 负 载 均衡 


Linux 操作 系统 从 2.0 版 内 核 开始 支持 对 称 多 处 理 ( Symmetric Multi Processing，SMP) 
架构 。 我 们 曾经 提 到 ， 当 一 个 系统 拥有 多 个 处 理 器 时 ， 将 会 有 多 个 有 效 运 行 队 列 一 一 每 个 处 
理 器 一 个 有 效 运行 队列 。 当 在 对 称 多 处 理 系 统 中 创建 进程 的 时 候 ， 它 们 被 放置 在 某 个 处 理 器 
的 运行 队列 上 。 一 些 进程 运行 时 间 很 短 ， 而 其 他 进程 则 可 能 会 运行 很 长 时 间 ， 并 且 操作 系统 
无 法 提前 知道 到 底 哪 些 进 程 运行 时 间 长 ， 哪 些 进程 运行 时 间 短 。 因 此 ， 不 可 能 一 开始 就 会 以 
一 种 均衡 的 方式 把 相关 进程 分 配 到 各 个 处 理 器 上 。 为 了 保持 处 理 器 之 间 的 工作 负载 的 均衡 ， 
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可 以 把 任务 从 负载 过 重 的 处 理 器 迁移 到 负载 较 轻 的 处 理 器 上 。Linux 调度 器 将 会 完成 此 类 负 
载 均衡 。 进 一 步 说 ， 操 作 系统 每 200 毫秒 就 会 检查 确认 处 理 器 负载 是 否 失衡 。 如 果 发 生 失 
衔 ， 操 作 系统 将 会 设法 实现 负载 均衡 。 显 而 易 见 ， 把 进程 移动 到 另 一 个 处 理 器 上 的 一 个 负面 
效应 是 ， 刚 开始 的 时 候 新 的 处 理 器 中 的 高 速 缓存 尚 不 持 有 相应 进程 的 任何 信息 。 这 无 疑 会 使 
得 有 效 的 存储 器 访问 时 间 临 时 性 大 幅 上 升 ， 然 而 对 比较 繁忙 的 处 理 器 上 的 负载 的 减轻 将 会 使 
这 一 问题 得 到 弥补 。 


19.3 ”内 存 管 理 


内 存 管理 器 ( Memory Manager，MM) 允许 多 个 进程 安全 地 共享 机 器 的 主 内 存 ( main 
memory， 简 称 主 存 或 内 存 ) 系统 。 此 外 ， 内 存 管理 器 支持 虚拟 内 存 ， 从 而 允许 Linux 系统 
支持 那些 所 需 内 存 比 系统 可 用 内 存 还 要 大 的 进程 。 内 存 中 存放 的 未 使 用 的 内 容 (包括 数据 和 
代码 ) 将 会 利用 文件 系统 换 出 到 持久 性 存储 器 ( persistent storage) 上 ， 而 如 果 以 后 要 再 次 使 
用 ， 则 会 重新 换 和 人 内存。 

Linux 操作 系统 从 一 开始 就 被 设计 成 是 独立 于 其 运行 的 硬件 平台 。 这 便 引 出 了 关于 操作 
系统 中 的 各 种 各 样 的 内 部 数据 结构 的 大 小 的 几 个 很 有 意思 的 问题 。Linux 系统 必须 应 对 的 第 
一 个 问题 是 ， 可 能 支撑 其 运行 的 机 器 的 基本 字 长 (word size) 往往 会 因 处 理 器 不 同 而 不 同 的 
事实 。 其 他 的 细节 ， 比 如 内 存 页 面 大 小 、 内 存 管理 硬件 工作 机 制 ， 等 等 ， 也 可 能 会 有 变化 。 
Linux 操作 系统 试图 通过 高 度 的 模块 化 和 高 度 的 可 配置 性 原则 来 处 理 这 些 问 题 。 虽 然 Linux 
是 一 个 庞大 内 核 的 操作 系统 ， 而 不 是 一 个 微 内 核 操 作 系统 ， 但 它 仍 然 是 高 度 模块 化 的 ， 故 
而 ， 用 另 一 个 不 同 的 模块 来 替换 一 个 模块 ， 璧 如 内 存 管理 模块 ， 是 相当 简单 和 方便 的 。 例 
如 ， 当 研究 表明 当前 所 用 的 机 制 并 没有 使 用 最 有 效 的 方法 的 时 候 ， 这 样 的 模块 替换 就 有 可 
能 发 生 ， 以 试图 去 使 用 刚刚 设计 开发 的 新 的 机 制 。 而 当 有 关 蔡 换 实 施 被 证 实 太 过 匆忙 并 实际 
上 会 导致 比 以 前 版 本 更 差 的 性 能 的 时 候 ， 也 可 能 会 发 生 此 类 模块 替换 。 例 如 ,在 Linux 内 核 
2.2 版 中 的 页 面 置换 算法 ， 曾 替换 了 此 前 所 使 用 的 算法 ,但 其 本 身后 来 却 被 证 明 是 存在 缺陷 
的 。 具 体 而 言 ， 虽 然 该 新 版 页 面 置换 算法 在 一 般 情 况 下 可 以 正常 运行 ,但 在 某 些 情况 下 ， 人 性 
能 可 能 会 变 得 极其 糟糕 。 因 此 ， 在 2.4 版 内 核 中 ， 又 重新 引入 了 部 分 的 早期 机 制 。 类 似 地 ， 
在 2.6 版 内 核 中 也 引入 了 前 面 所 描述 的 时 间 复 杂 度 为 O(1) 的 调度 器 。 

现代 Linux 内 核 的 内 存 管 理 器 是 一 个 完全 的 请 求 分 页 式 虚 拟 内 存 管理 器 。 我 们 在 第 11 
章 曾 经 非常 详尽 地 讨论 过 相关 技术 ， 所 以 在 这 里 不 再 著述 。 需 要 说 明 的 是 ， 对 于 x86 处 理 器 
而 言 ，Linux 系统 采用 两 级 页 表 ， 而 对 于 64 位 处 理 器 而 言 ， 其 则 采用 三 级 页 表 。 从 理论 上 
来 说 ， 分 页 机 制 消 除了 对 连续 内 存 分 配 的 要 求 ， 但 是 像 内 存 直 接 存 取 (DMA) 等 某 些 操作 ， 
则 会 忽略 分 页 硬件 电路 ( paging circuitry)， 并 在 传输 数据 时 直接 访问 地 址 总 线 。 考 虑 到 这 个 
问题 ，Linux 系统 于 是 实现 了 一 种 称 为 伙伴 系统 (buddy system) 算法 的 用 于 分 配 连续 页 框 
的 机 制 。 相 关 页 框 信 息 被 保存 在 系统 设立 的 10 个 物理 块 链 表 中 ， 且 这 10 个 物理 块 链表 分 别 
对 应 包含 1、2、4、8、16、32、64、128、256 或 512 个 连续 页 框 的 物理 块 大 小 。 当 接收 到 
关于 连续 内 存 物 理 块 的 申请 时 ， 内 存 管理 器 将 会 在 物理 块 链表 中 查找 相应 大 小 或 更 大 的 物理 
块 ， 如 果 需 要 ， 还 将 对 有 关 物 理 块 实施 分 割 处 理 。 相 反 ， 当 物理 块 被 释放 的 时 候 ， 内 存 管理 
器 将 会 迭代 式 尝试 把 空闲 物理 块 对 合并 成 更 大 的 物理 块 。 简 言 之 ，Linux 设立 了 一 组 单独 的 
对 应 于 低 址 内 存 故而 适合 于 直接 内 存 访问 操作 的 伙伴 系统 链表 。 

Linux 操作 系统 还 建立 了 一 种 单独 的 称 为 内 存 对 象 集 分 配器 (slab allocator， 或 称 为 Slab 
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分 配器 ) 的 机 制 来 处 理 关 于 小 的 内 存 区 域 的 申请 。 内 存 对 象 集 分 配器 并 非 是 从 单个 堆 中 随机 
地 去 分 配 所 有 的 存储 请 求 ， 而 是 把 内 存 看 作 同 类 对 象 ， 壁 如 进程 描述 符 ( process descriptor ) 
的 集合 。 进 一 步 说 ， 内 存 对 象 集 分 配器 将 会 针对 所 谓 内 存 对 象 集 ( slab) 的 物理 块 来 实施 同 
类 对 象 的 分 配 ， 有 关 物 理 块 只 保存 单一 类 型 的 对 象 。 鉴 于 许多 这 样 的 对 象 的 初始 化 操作 比重 
新 分 配 还 需要 更 多 的 时 间 开 销 ， 因 此 当 一 个 对 象 被 释放 的 时 候 ， 其 往往 被 缓存 处 理 从 而 方便 
以 后 再 次 作为 同一 类 型 的 对 象 加 以 使 用 。 内 存 对 象 集 机 制 并 不 仅仅 限于 系统 定义 的 对 象 。 应 
用 程序 也 可 以 创建 自己 的 内 存 对 象 集 链表 ， 并 让 内 存 管理 器 以 相同 的 方式 来 对 它们 进行 管理 。 

Linux 操作 系统 的 模块 化 设计 支持 在 不 同 的 版 本 或 不 同 的 发 行 版 中 使 用 不 同 的 内 存 管理 
器 。 进 一 步 说 ， 鉴 于 虚拟 内 存 体系 结构 并 不 拥有 确定 的 性 能 ， 所 以 仅 用 于 实时 版 本 的 Linux 
操作 系统 的 发 行 版 可 能 必须 得 避免 基于 虚拟 内 存 体系 结构 来 进行 设计 。 类 似 地 ， 嵌 入 在 没有 
辅助 存储 器 的 掌上 电脑 或 微波 中 的 基于 Linux 的 系统 可 以 使 用 更 适合 于 相应 硬件 配置 条 件 的 
内 存 管 理 器 。 在 第 20 章 中 ,我们 将 会 就 展现 此 类 内 存 管理 器 的 Symbian 操作 系统 及 其 关于 
分 页 硬件 的 一 种 非常 精巧 的 使 用 展开 进一步 的 讨论 。 


19.4 文件 支持 


每 个 操作 系统 设计 人 员 都 必须 做 出 的 一 项 决定 是 文件 系统 在 辅助 存储 器 (通常 是 磁盘 ) 
上 的 物理 和 逻辑 布局 。 一 般 可 以 采用 若干 可 选 的 文件 系统 布局 ， 并 且 有 关 差 异 可 能 会 对 操作 
系统 的 性 能 产生 巨大 的 影响 。 同 样 ，Linux 操作 系统 的 模块 化 特性 在 文件 支持 方面 再 次 得 到 
了 淋 演 尽 致 的 展现 。 


19.4.1 标准 文件 系统 


如 前 所 述 ，Linux 操作 系统 的 原始 版 本 是 在 MINIX 系统 基础 上 开发 出 来 的 。 因 此 很 自 
然 地 ， 最 初 的 Linux 版 本 中 所 使 用 的 文件 系统 就 是 围绕 MINIX 文件 系统 的 物理 和 逻辑 布局 
而 设计 的 。 即 使 在 今天 ，Linux 操作 系统 仍然 支持 MINIX 文件 系统 布局 。 由 于 Linux 的 各 
种 各 样 的 开发 人 员 为 自己 的 Linux 操作 系统 版 本 设 定 了 不 同 的 使 用 目标 ， 所 以 Linux 对 许多 
其 他 的 文件 系统 布局 也 提供 支持 ， 具 体 包括 MS-DOS、OS/2、 光 盘 、 数 字 化 视频 光盘 以 及 
其 他 的 ( 非 Linux 的 ) UNIX 版 本 。 尽 管 如 此 ， 对 于 Linux 硬盘 来 说 ， 确 实 存在 一 种 标准 的 
文件 系统 ， 即 ext2fs (第 二 代 扩 展 文 件 系 统 )。 许 多 Linux 系统 文档 经 常会 讨论 到 “ Linux 文 
件 系 统 ”， 似 乎 该 文件 系统 就 是 目前 使 用 的 唯一 的 一 种 文件 系统 。 然 而 ， 开 源 项 目 导致 的 错 
综 复 杂 在 于 ,开发 人 员 可 以 随意 创建 他 们 喜欢 的 操作 系统 的 任何 变 体 。 这 通常 是 好 的 ， 因 为 
其 能 够 鼓励 试验 和 创新 。 但是， 这 也 可 能 会 成 为 一 个 问题 ， 因 为 其 有 可 能 会 使 初学 者 的 选择 
变 得 复杂 化 。 于 是 ， 有 人 认为 ， 从 更 大 的 Linux 用 户 社区 的 角度 来 看 ， 如 果 只 关注 少数 几 种 
文件 系统 ,那么 稀缺 资源 可 能 会 得 到 更 有 效益 的 利用 。 表 19-1 给 出 了 已 经 创建 的 一 些 其 他 
Linux 文件 系统 。 


表 19-1 其 他 Linux 文件 系统 


EXT 扩展 文件 系统 (代替 了 MINIX) 
EXT2 . 第 二 代 扩 展 文件 系统 
EXT3 第 三 代 扩 展 文 件 系统 


XFS 硅谷 图 形 公司 (Silicon Graphics) IRIX 操作 系统 之 日 志 式 文件 系统 
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( 续 ) 
HFS Mac 操作 系统 之 多 级 文件 系统 
EFS 硅谷 图 形 公司 IRIX 操作 系统 之 扩展 文件 系统 
VxFS Veritas 文件 系统 
UFS 早期 伯克利 软件 发 行 版 (BSD) UNIX 文件 系统 
BSD FFS BSD UNIX 文件 系统 
AIX IBM RS/6000 UNIX 文件 系统 
JFS IBM 日 志 式 文件 系统 
HPFS OS/2 高 性 能 文件 系统 
BeFS BeOS 文件 系统 
QNX4FS QNX4 操作 系统 之 文件 系统 
AFFS Amiga 操作 系统 之 快速 文件 系统 
FAT16 微软 DOS 操作 系统 之 文件 系统 
FAT32 Windows 操作 系统 之 文件 系统 
ReiserFS 新 型 Linux 文件 系统 ReiserFS (采用 了 完全 平衡 树 结构 ) 
Xia 新 型 MINIX 文件 系统 


19.4.2 ”虚拟 文件 系统 


Linux 操作 系统 的 这 种 拥有 诸多 不 同 但 共存 的 文件 系统 的 想法 并 不 是 什么 新 鲜 的 东西 。 从 
许多 大 学 取得 UNIX 操作 系统 源码 并 对 之 进行 “改良 ”以 适应 某 种 特定 的 局 部 需要 的 角度 来 
说 ，UNIX 也 是 以 类 似 于 Linux 的 方式 开发 和 发 展 起 来 的 。 一 种 常见 的 更 改 情况 是 ， 为 UNIX 
设计 一 种 新 的 文件 系统 ， 以 使 用 来 自 某 些 传统 操作 系统 的 现 有 的 文件 系统 ， 例 如 表 19-1 中 
的 高 性 能 文件 系统 (HPFS)。 为 了 处 理 文件 系统 的 这 种 多 样 性 ，UNIX 引入 了 虚拟 文件 系统 
(Virtual File System，VFS) 的 概念 。 虚 拟 文件 系统 是 操作 系统 内 部 介 于 内 核 系 统 调 用 和 文件 
系统 之 间 的 一 个 附加 层 ， 而 且 它 对 于 应 用 程序 是 不 可 见 的 ， 如 图 19-3 所 示 。 这 一 层 的 应 用 
程序 接口 与 标准 UNIX 文件 系统 的 应 用 程序 接口 完全 相同 。 当 通过 虚拟 文件 系统 层 打开 一 个 
文件 时 ， 虚 拟 文件 系统 将 会 查看 所 引用 的 设备 上 的 文件 系统 类 型 ， 并 将 对 应 请 求 传递 给 该 设 
备 的 相应 文件 系统 驱动 程序 。 无 论 是 驱动 程序 还 是 应 用 程序 都 不 知道 这 一 附加 层 的 存在 。 在 
其 他 的 操作 系统 中 ， 有 关 概 念 有 时 被 称 为 文件 重 定向 器 (redirector)。 

这 种 简单 的 机 制 促进 了 许多 原本 可 能 很 困难 的 事情 的 发 展 。 例 如 ， 当 引入 只 读 光 盘 
( Compact Disc Read-Only Memory，CD-ROM) 设备 的 时 候 ， 工 业界 就 能 够 在 单一 数据 文件 
格式 (音乐 光盘 遵循 另外 不 同 的 旧 的 格式 ) 基础 上 进行 标准 化 。 其 部 分 原因 在 于 ，UNIX (以 
及 其 他 的 操作 系统 ) 已 能 够 在 这 些 设备 上 支持 一 种 不 同 于 硬盘 或 软盘 上 的 文件 系统 格式 。 这 
对 于 工业 界 和 用 户 群 体 来 说 具有 极 大 的 好 处 。 想 象 一 下 ， 如 果 每 种 操作 系统 都 有 其 自己 的 
光盘 格式 ， 那 将 是 怎样 一 种 情形 ! 你 真 的 不 难 想象 到 一 一 其 会 与 以 前 的 软盘 行业 别 无 两 样 。 
具体 而 言 ， 你 必须 得 购买 已 经 按照 你 即将 要 使 用 的 操作 系统 的 要 求 格 式 化 过 的 软盘 ， 磁 盘 
可 能 是 固定 扇 区 (hard-sectored， 或 称 为 硬 扇 区 )， 也 可 能 是 软 扇 区 (soft sectored)， 并 且 具 
有 不 同 的 密度 〈 指 每 个 磁道 可 以 容纳 的 扇 区 数量 )。 至 少 对 于 软盘 的 例子 来 说 ， 当 微软 DOS 
系统 流行 开 来 的 时 候 ， 其 软盘 格式 便 无 处 不 在 ， 于 是 各 种 操作 系统 不 得 不 以 某 种 方式 来 
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处 理 DOS 格式 的 软盘 ， 所 以 情况 并 没有 像 预料 中 那么 糟糕 。 另 外 ， 太 阳 微 系统 公司 ( Sun 
Microsystems) 则 利用 这 种 机 制 引 入 了 一 种 “文件 系统 ”， 其 实际 上 是 一 种 访问 不 在 本 地 磁盘 
上 的 文件 的 网 络 协议 ， 也 就 是 说 ， 有 关 文 件 其 实 是 跨 网 络 驻 留 的 。 相 关机 制 的 远程 特性 对 于 
应 用 程序 来 说 是 完全 透明 的 ， 但 是 对 这 项 功能 的 简单 使 用 有 时 可 能 会 严重 地 影响 系统 性 能 。 
这 种 文件 系统 被 称 为 网 络 文件 系统 (Network File System，NFS )。 





远程 服务 器 
( 网 络 文件 系统 ) 


图 19-3 ”Linux 虚拟 文件 系统 (VFS) 


19.4.3 ”进程 文件 系统 


Linux 操作 系统 (以 及 UNIX 的 一 些 衍 生 版 操作 系统 ) 还 以 一 种 非常 有 创意 的 方式 来 
利用 文件 系统 接口 。 进程 文件 系统 (proc file system) 从 其 没有 引用 磁盘 上 文件 的 角度 来 
说 ， 并 算 不 上 一 种 真正 的 物理 文件 系统 。 它 有 时 被 称 为 虚 文 件 系 统 或 伪 文 件 系 统 ( pseudo 
file system)， 并 被 认为 是 非 持久 性 的 。 它 会 响应 大 多 数 的 与 任何 其 他 文件 系统 相同 的 系统 调 
用 , 但 是 并 不 访问 存储 设备 ， 而 是 返回 关于 操作 系统 内 核 相关 变量 的 信息 。 鉴 于 根 文件 系 
统 (root file system) 是 通过 标准 输入 /输出 调用 来 进行 访问 的 ， 所 以 人 们 经 常 只 是 打开 一 个 
proc 表 项 (位 于 proc 子 目录 中 ) 然后 读 取 对 应 的 内 容 。 有 关 返 回 的 信息 实际 上 并 不 以 那样 的 
格式 存在 于 内 核 中 (虽然 有 些 部 分 可 能 是 这 样 )， 而 是 在 执行 读 取 操 作 时 动态 创建 的 。 相 关 
记录 包括 关于 在 系统 上 运行 的 进程 的 信息 以 及 关于 诸如 网 络 、 内 存 管理 等 其 他 模块 的 信息 。 
在 用 户 看 来 ， 进 程 文件 系统 内 部 甚至 还 有 目录 。 例 如 ， 有 一 个 /proc/net 目录 ， 其 中 包含 有 
关 网 络 模块 的 所 有 信息 。 其 他 目录 则 往往 对 应 于 系统 上 运行 的 各 个 进程 。 这 些 目录 有 了 时 会 包 
含 子 目录 来 对 应 于 特定 模块 的 子 功能 。 例 如 ，/proc/net 目录 包含 有 对 应 地 址 解析 协议 表 ( 即 
arp 表 ) 的 子 目录 以 及 对 应 于 传输 控制 协议 和 网 际 协议 等 网 络 协议 的 参数 和 计数 器 的 子 目 录 。 
请 注意 ， 进 程 文件 系统 既 支 持 读 操作 ， 也 支持 写 操 作 ， 故 而 内 核 中 的 数据 可 以 被 小 心 谨慎 
地 加 以 更 改 。 通 常情 况 下 ， 这 意味 着 只 有 具有 root (超级 用 户 ) 权限 的 用 户 才 能 写 人 此 文件 
系统 。 


19.5 ”基本 输入 /输出 
19.5.1 设备 表 
设备 表 ( /dev table) 即 设备 “文件 系统 ”， 是 在 Linux 系统 中 可 以 见 到 的 一 种 独立 的 类 
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似 于 进程 文件 系统 的 “文件 系统 ”。Linux 系统 上 的 大 多 数 设备 都 在 /dev 目录 中 拥有 一 个 相 
对 应 的 “文件 ”"， 当 然 ， 网 络 设备 是 个 例外 。 同 时 ，/dev 目录 中 的 每 个 文件 都 有 一 个 相关 联 
的 主 设备 号 ( major device number) 和 次 设备 号 (minor device number)。 而 内 核 将 会 利用 这 
些 编号 来 实现 从 设备 文件 引用 到 相应 的 驱动 程序 的 映射 。 

具体 来 说 ， 主 设备 号 标识 了 与 对 应 文件 相关 联 的 驱动 程序 ( 换 句 话说 ， 就 是 设备 的 类 
型 )。 有 关 编 号 由 Linux 名 称 和 编号 分 配 机 构 ( Linux Assigned Names And Numbers Authority ， 
LANANA) 负责 分 配 和 指定 。 而 次 设备 号 则 通常 用 来 标识 将 被 寻 址 的 给 定 设 备 类 型 的 某 个 特 
定 的 实例 。 例如， 对 于 硬盘 而 言 ， 可 以 有 不 同类 型 的 硬盘 ， 如 小 型 计算 机 系统 接口 ( Small 
Computer System Interface，SCSI) 类 型 和 串 行 高 级 技术 连接 ( Serial Advanced Technology 
Attachment，SATA 或 串 行 ATA ) 接口 类 型 ， 而 且 可 能 有 两 个 串 行 高 级 技术 连接 接口 类 型 
SATA 的 硬盘 ， 后 者 根据 次 设备 号 来 加 以 区 分 。 为 此 ,次 设备 号 有 时 也 被 称 为 部 件 编号 。 

通过 在 Linux 命令 解释 器 (shell， 或 称 为 外 壳 程 序 ) 中 输入 以 下 命令 ， 就 可 以 查看 设备 
文件 的 主 设备 号 和 次 设备 号 : 

ls -1 /dev/sda 

brw-rw---- 1 root disk 8, 0 Mar 3 2007 /dev/sda 
该 示例 给 出 了 Linux 系统 上 的 第 一 个 小 型 计算 机 系统 接口 类 型 SCSI 的 磁盘 。 它 的 主 设备 号 
是 8， 而 次 设备 号 为 0。 次 设备 号 有 时 被 相应 驱动 程序 用 来 选择 设备 的 某 些 特殊 的 特性 。 例 
如 ， 一 台 磁 带 驱动 器 可 能 在 /dev 目录 中 拥有 若干 不 同 的 分 别 用 来 表示 各 种 记录 密度 和 倒 带 
特性 配置 的 文件 。 事 实 上 ， 有 关 驱 动 程序 可 以 采用 任何 其 想 要 的 方式 来 使 用 次 设备 号 。 

请 注意 ， 上 面 的 “1s” 命 令 通 常用 于 显示 一 个 目录 中 的 文件 ， 这 里 却 被 用 来 显示 设备 的 
特性 ， 就 像 它 是 一 个 实际 的 物理 文件 一 样 。 


19.5.2 ”设备 类 型 


与 大 多 数 的 操作 系统 一 样 ，Linux 操作 系统 大 体 上 也 把 设备 划分 为 三 种 类 型 ， 即 块 设备 、 
字符 设备 和 网 络 设备 ， 并 且 对 每 种 类 型 的 设备 采取 了 不 同 的 处 理 方式 。 图 19-4 显示 了 Linux 
系统 的 一 些 内 核 输入 /输出 模块 以 及 彼此 之 间 的 关系 。 








19-4 Linux 输入 /输出 系统 
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块 设备 
对 于 Linux 操作 系统 来 说 ， 往 往 通过 文件 系统 来 访问 块 模式 的 设备 (block mode device， 
即 块 设备 )， 即 使 是 磁带 存储 器 也 是 如 此 。 同 时 ，Linux 还 支持 直接 对 设备 进行 原始 的 输入 / 
输出 (raw WO) 操作 。 
字符 设备 
字符 模式 设备 ( character mode device ， 即 字符 设备 ) 每 次 传输 一 个 字 贡 的 数据 ， 包 括 打 
印 机 、 键 盘 、 鼠 标 〈《 和 其 他 的 指针 式 设备 ) 等 。 一 般 而 言 ， 程 序 可 以 使 用 ioctl 系统 调用 访问 
大 多 数 的 字符 模式 的 设备 。 
网 络 设备 
网 络 设备 不 符合 文件 的 语义 ， 因 为 等 待 输入 的 应 用 程序 永远 也 不 会 知道 相关 输入 何 时 可 
能 到 达 。 因 此 ， 网 络 设 备 具有 一 套 与 其 他 设备 完全 不 同 的 接口 。 
鉴于 网 络 设备 的 操作 是 如 此 得 与 众 不 同 ， 所 以 它们 并 没有 出 现在 设备 表 (/dev) 中 。 相 
反 ， 它们 拥有 另外 的 一 套 通用 的 网 络 接口 ， 其 在 大 多 数 情况 下 遵循 传输 控制 协议 和 网 际 协议 . 
(或 用 户 数据 报 协议 ) 的 协议 栈 模型 ， 并 且 经 常 利 用 所 谓 套 接 字 (socket) 的 编程 模型 来 进行 
访问 。 有 关 编 程 模型 是 一 种 应 用 程序 接口 ， 允 许 一 个 应 用 程序 与 另 一 个 应 用 程序 建立 网 络 连 
接 ， 有 可 能 但 不 一 定 是 在 不 同 的 系统 上 ， 并 且 在 两 个 应 用 程序 之 间 发 送 和 接收 一 连 串 数据 或 
一 系列 数据 块 。 这 一 模型 具有 数据 链 路 、 网 络 和 传输 控制 服务 等 层级 。 大 多 数 类 型 的 设备 驱 
动 程序 都 保存 着 关于 对 应 操作 (包括 错误 ) 的 各 种 各 样 的 使 用 统计 信息 ， 以 便 系 统管 理 员 可 
以 优化 系统 的 性 能 。 网 络 驱动 程序 比 大 多 数 其 他 的 驱动 程序 更 为 积极 主动 ， 通 常情 况 下 会 保 
存 许多 不 同类 型 的 统计 信息 ， 包 括 错 误 计数 器 以 及 发 送 和 接收 的 数据 包 数 量 。 相 关 网 络 模 块 
通过 一 套 通用 的 网 络 接口 ， 来 支持 连接 、 发 送 、 接 收 、 超 时 处 理 、 统 计 收 集 以 及 路 由 等 公共 
操作 。 由 于 UNIX 操作 系统 的 起 源 是 与 传输 控制 协议 和 网 际 协议 的 利用 紧密 联系 在 一 起 的 ， 
所 以 获知 Linux 驱动 程序 针对 传输 控制 协议 和 网 际 协 议 的 支持 进行 了 优化 也 不 足 为 怪 。 尽 管 
如 此 ， 再 次 强调 ，Linux 操作 系统 的 开放 性 和 Linux 支持 人 员 的 多 样 化 需求 导致 了 许多 其 他 
网 络 协议 也 针对 Linux 进行 了 改编 处 理 。 如 下 是 可 供 Linux 操作 系统 使 用 的 许多 其 他 协议 中 
的 一 部 分 : 
e 网 络 协议 〈 软 件 协议 ) 
晶 第 6 版 网 际 协议 (IP version 6 ) 一 一 互联 网 和 第 二 代 互 联网 (Internet 2 ) 
四 互联 网 数据 包 交 换 (Internet Packet Exchange，IPX) 协议 和 序列 数据 包 交 换 
(Sequenced Packet Exchange，SPX) 协议 一 一 Novell 公司 ( 诺 勒 ) 
四 苹果 对 话 (AppleTalk) 协议 簇 一 一 苹果 公司 
和 网 络 基本 输入 /输出 系统 增强 型 用 户 接 口 ( NetBIOS Enhanced User Interface，Net- 
BEUI) 协议 一 一 IBM 公司 和 微软 公司 
四 网 络 基本 输入 /输出 系统 协议 (NETwork Basic Input Output System，NetBIOS ) 一 一 
IBM 公司 和 微软 公司 
加 通用 互联 网 文件 系统 (Common Internet File System，CIFS) 协议 一 一 微软 公司 
四 系统 网 络 体 系 结构 (Systems Network Architecture，SNA) 协议 一 一 IBM 公司 
备 程序 与 程序 间 高 级 通信 ( Advanced Program-to-Program Communication,APPC) 
协议 一 一 IBM 公司 
上 数字 设备 公司 分 层 网 络 体系 结构 协议 ( Digital Equipment Corporation Network， 
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DECNet) 一 一 DEC 公司 

e 物理 协议 (硬件 协议 或 路 由 器 和 交换 机 接口 ) 

四 综合 业务 数字 网 络 (Integrated Services Digital Network，ISDN) 协议 

昌 点 对 点 协议 (Point-to-Point Protocol，PPP) 

到 串 行 线路 接口 协议 (Serial Line Interface Protocol，SLIP) 

香 并 行 线路 互联 网 协议 (Parallel Line Internet Protocol，PLIP ) 

香 业余 无 线 电 联 盟 数据 链 路 层 协议 (Amateur Radio - AX25 ) 

到 异步 传输 模式 (Asynchronous Transfer Mode，ATM) 协议 

至 附属 资源 计算 机 网 络 ( Attached Resource Computer Network，ARCNet) 协议 一 一 
Datapoint 公司 等 

到 光纤 分 布 式 数据 接口 (Fiber Distributed Data Interface，FDDI) 协议 

晶 帧 中 继 (Frame Relay) 

日 令 牌 环 (Token Ring) 一 一 IBM 公司 

到 X.25 协议 一 一 慢 速 、 异 步 方式 

至 802.11 协议 一 一 无 线 局 域 网 

四 蓝牙 (Bluetooth) 协议 一 一 无 线 网 络 

为 了 保持 其 UNIX 导向 ，Linux 操作 系统 为 套 接 字 和 数据 报 机 制 提供 了 强 有 力 的 支持 。 
有 关机 制 在 1994 年 就 被 包含 在 Linux 内 核 1.0 版 本 中 ， 而 这 种 机 制 是 通过 伯克利 软件 发 行 
版 (BSD) 4.3 版 的 UNIX 而 被 引入 UNIX 操作 系统 领域 的 。 相 关 网 络 接口 及 对 应 机 制 在 第 
15 章 曾 进 行 过 较为 详尽 的 讨论 ， 在 此 不 再 著述 。 

磁盘 调度 

在 第 14 章 ， 我 们 讨论 了 操作 系统 在 磁盘 驱动 器 上 的 调度 操作 的 诸多 选项 ， 例 如 ， 何 时 
移动 到 下 一 个 磁道 以 及 移动 到 哪 条 磁道 。 本 章 则 强调 的 是 作为 Linux 操作 系统 优势 之 一 的 模 
块 化 。 这 种 模块 化 允许 用 另 一 不 同 的 实现 方案 来 替换 Linux 操作 系统 中 的 个 别 模块 ， 因 为 相 
应 实现 方案 更 适合 于 特定 的 情况 。 关 于 磁盘 操作 的 调度 就 是 这 方面 的 一 个 很 好 的 例子 。 虽 然 
默认 的 磁盘 调度 器 ( disk scheduler， 或 称 为 磁盘 调度 程序 ) 在 一 般 情 况 下 是 公平 的 并 且 执 行 
得 也 很 好 ， 但 是 任何 特定 系统 的 总 体 性 能 在 很 大 程度 上 往往 取决 于 正在 实施 的 处 理 的 类 型 。 
例如 ， 万维网 服务 器 ( Web server， 或 称 为 网 站 服务 器 ) 对 系统 的 要 求 就 与 数据 库 服务 器 对 
系统 的 要 求 差 别 很 大 。 因 此 ， 在 Linux 操作 系统 中 同时 提供 了 若干 不 同 的 磁盘 调度 器 ， 而 这 
些 磁 盘 调 度 器 往往 能 够 比 其 他 未 人 选 的 磁盘 调度 器 更 好 地 适合 相应 的 情况 。 在 过 去 ，Linux 
系统 中 默认 的 磁盘 调度 器 一 直 采 用 的 是 循环 向 前 看 调度 算法 (Circular-LOOK，C-LOOK ) 。 
该 算法 把 磁盘 看 作 是 一 个 圆柱 ， 从 驱动 器 的 一 端 开始 ， 在 行进 中 按 序 处 理 相关 操作 。 当 到 达 
请 求 操 作 队 列 的 末端 时 ， 将 会 把 磁头 直接 移 回 到 另 一 端 且 期 间 不 处 理 任何 请 求 ， 然 后 开始 处 
理 在 上 一 轮 扫描 期 间 磁头 移动 过 程 中 所 积累 起 来 的 请 求 操作 。 需 要 指出 的 是 ,后 来 的 Linux 
发 行 版 本 已 经 开始 结合 使 用 更 为 先进 的 调度 算法 。 

Linux 系统 中 磁盘 调度 器 的 最 新 发 展 状况 充分 展示 了 可 替换 模块 是 如 何 被 用 来 获得 
巨大 的 好 处 的 。 如 前 所 述 ，Linux 操作 系统 中 的 磁盘 调度 器 基本 上 是 一 个 循环 向 前 看 调度 
(C-LOOK) 程序 ， 其 仅仅 处 理 在 寻 道 方向 上 的 请 求 操作 。 然 而 有 人 指出 ， 这 有 时 会 造成 那些 
与 其 他 大 部 分 请 求 相距 很 远 的 磁盘 操作 请 求 的 调度 服务 遭受 严重 不 公平 待遇 的 情况 。 为 了 改 
变 这 种 相关 请 求 被 “ 慢 待 ”的 状况 ，Linux 磁盘 调度 器 进行 了 修改 ， 即 为 每 个 新 请 求 设立 了 
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一 个 截止 时 间 。 如 果 某 个 请 求 的 截止 时 间 即 将 到 达 ， 那 么 该 请 求 应 当 立 即 得 到 服务 。 显 然 ， 
如 此 改造 后 的 算法 在 某 些 情况 下 能 够 提供 更 好 的 性 能 。 

遗憾 的 是 ， 执 行 大 量 读 取 操 作 的 应 用 程序 往往 倾向 于 采用 同步 输入 /输出 方式 。 进 一 步 
说 ， 通 常情 况 下 ， 有 关 应 用 程序 一 般 会 先 读 取 一 个 数据 块 ， 接 着 对 该 数据 块 进行 处 理 ， 然 后 
再 发 出 读 取 下 一 数据 块 的 请 求 。 然 而 ， 就 在 对 相应 数据 块 处 理 的 同时 ， 磁 头 已 被 移动 到 驱动 
器 的 另 一 位 置 ， 而 且 直到 很 久 以 后 方 可 满足 刚才 的 那个 应 用 程序 所 提出 的 读 取 下 一 数据 块 的 
请 求 。 为 了 改善 此 类 应 用 程序 的 磁盘 操作 性 能 ，Linux 操作 系统 在 2.6 版 中 引入 了 新 的 预测 
式 调度 器 ( anticipatory scheduler)。 该 调度 器 基本 上 采用 的 还 是 循环 向 前 看 调度 ( C-LOOK) 
算法 ， 但 是 当 执行 读 操作 时 ， 将 会 对 把 磁头 移 离 当前 所 读数 据 块 的 动作 延迟 很 短 的 一 段 时 间 
(也 就 几 毫秒 吧 )， 从 理论 上 来 说 主要 是 考虑 到 有 关 应 用 程序 可 能 很 快 就 会 发 出 针对 下 一 个 数 
据 块 的 新 的 读 取 请 求 。 这 种 方案 在 某 些 情况 下 例如 编译 时 表现 得 很 好 ,但 在 其 他 情况 下 ， 特 
别 是 对 于 交互 式 任 务 来 说 ,通常 比较 糟糕 。 之 所 以 整体 性 能 较 差 ,应 该 是 由 于 没有 保持 寻 道 
机 制 始终 处 于 忙碌 状态 而 引起 的 。 

为 此 ， 另 外 的 一 种 调度 器 又 被 发 布 出 来 ， 称 之 为 完全 公平 排队 (Complete Fair Queuing， 
CFQ) 调度 器 。 完 全 公平 排队 调度 器 把 同步 请 求 放 置 到 每 个 进程 的 单独 队列 中 ， 同 时 为 每 个 
队列 访问 磁盘 分 配 相应 的 时 间 片 。 时 间 片 的 长 短 以 及 队列 允许 提交 的 请 求 操作 数 取 决 于 分 配 
给 相应 进程 的 输入 /输出 优先 级 。 与 此 同时 ， 蜡 步 类 型 的 请 求 被 批量 分 到 各 个 优先 级 的 单独 
的 队列 中 。 完 全 公平 排队 调度 器 并 不 进行 预测 式 输入 /输出 调度 ,但 通过 允许 进程 队列 在 同 
步 输 入 /输出 结束 时 “空转 ”， 故 而 可 能 “预见 /遇见 ”相应 进程 的 进一步 的 输入 /输出 操作 
请 求 ， 从 而 为 整个 系统 提供 不 错 的 吞吐 量 。 完 全 公平 排队 调度 器 作为 Linux 2.6.18 内 核 的 一 
部 分 被 发 布 ， 并 且 是 该 内 核 版 本 中 默认 的 调度 器 。 

鉴于 不 存在 对 所 有 情况 总 能 表现 最 佳 的 调度 器 ， 所 以 目前 Linux 提供 了 4 种 可 用 的 调 
度 器 ， 

Noop 调度 需 

预测 式 输入 /输出 调度 器 (as 调度 器 ) 
基于 截止 时 间 的 调度 器 

完全 公平 排队 调度 器 (cfq 调度 器 ) 

人 们 可 以 在 系统 引导 时 通过 设置 内 核 选项 elevator 来 更 改 调度 器 。 进 一 步 说 ， 可 以 把 调 
度 器 设置 为 预测 式 输入 /输出 调度 器 (as)、 完 全 公平 排队 调度 器 〈cftq)、 基 于 截止 时 间 的 调 
度 器 (deadline) 以 及 Noop 调度 器 (noop) 中 的 一 种 。 此 外 ， 一 些 调度 器 所 拥有 的 某 些 参数 
可 以 在 运行 时 进行 调整 。 


19.6 图形 化 用 户 接口 编程 


当 创 建 UNIX 操作 系统 的 时 候 ， 几 乎 没有 什么 计算 机 的 工作 是 在 图 形 模式 下 完成 的 。 相 
反 ， 许 多 用 户 往往 通过 一 个 基本 上 也 就 是 个 打字 机 (typewriter) 或 电 传 打 字 机 (Teletype) 
一 个 内 置 有 键盘 的 打印 机 一 一 的 终端 连接 到 计算 机 上 。 当 阴极 射线 管 ( Cathode Ray Tube， 
CRT) 终端 开始 使 用 时 ， 它 们 通常 也 就 显示 文本 ， 在 很 大 程度 上 与 当时 使 用 的 打印 机 终端 差 
不 多 。 而 支持 图 形 的 终端 的 成 本 可 能 与 其 所 连接 的 计算 机 几 近 相同 。 在 这 种 情况 下 ，UNIX 
内 核 便 假定 用 户 界 面 不 是 图 形 化 用 户 界 面 ( Graphical User Interface，GUI， 或 称 为 图 形 化 用 
户 接口 )。 反 之 ， 如 果 想 要 图 形 化 用 户 界面 ,那么 必须 得 采用 一 种 与 操作 系统 内 核 相 分 离 的 
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机 制 来 提供 。 于 是 ，X-Window 系统 就 被 构建 用 来 提供 相关 机 制 和 实现 在 UNIX 操作 系统 中 
的 图 形 显示 。 需 要 指出 的 是 ，X-Window 系统 是 与 平台 无 关 的 、 用 于 显示 图 形 的 基于 客户 端 / 
服务 器 的 协议 。 关 于 X-Window 系统 相关 组 件 的 框图 如 图 19-5 所 示 。 有 关 组 件 的 命名 在 今 
天 看 来 或 许 会 令 人 感到 困惑 一 一 将 看 图 形 的 系统 称 为 X-Window 服务 器 ， 而 把 生成 图 形 的 系 
统称 为 X-Window 客户 端 。 服 务 器 和 客户 端 有 可 能 运行 在 相同 的 机 器 上 ， 就 像 它们 经 常 在 
Linux 个 人 计算 机 环境 中 的 那样 ， 或 者 它们 也 可 能 是 通过 网 络 连接 而 分 布 在 世界 两 端的 不 同 
的 系统 上 。 








图 19-5 X-Window 系统 


X-Window (或 X11 ) 协议 需要 第 三 个 组 件 ， 以 按照 由 管理 员 所 确定 的 方式 来 绘制 和 实 
际 显 示 窗 口 、 菜 单 、 框 和 滚动 条 ， 有 关 组 件 被 称 为 窗口 管理 器 ( window manager)。 窗 口 管 
理 器 决定 了 界面 的 外 观 以 及 用 户 与 其 交互 的 方式 一 一 即 所 谓 的 外 观 和 感觉 (look-and-feel)。 
在 单个 机 器 上 运行 的 X-Window 服务 器 和 窗口 管理 器 通常 提供 了 熟悉 的 图 形 化 用 户 界面 。 目 
前 在 Linux 操作 系统 领域 ， 主 要 有 两 种 非常 受 欢 迎 的 窗口 管理 器 一 一 KDE (Kool Desktop 
Environment，Kool 桌面 环境 ) 和 GNOME (GNU Network Object Model Environment，GNU 网 
络 对 象 模型 环境 )。 这 两 种 窗口 管理 器 在 大 多 数 的 Linux 发 行 版 中 都 可 以 找到 ， 相 关 发 行 版 
中 偶尔 也 会 包含 其 他 不 那么 流行 的 窗口 管理 器 。 鉴 于 Linux 应 用 程序 通常 使 用 X-Windows 
应 用 程序 接口 在 系统 上 进行 绘制 ， 所 以 ， 与 任何 一 个 窗口 管理 器 一 起 运行 的 程序 往往 也 可 以 
与 任何 其 他 的 窗口 管理 器 一 起 正常 工作 。 不 过 ， 对 话 框 、 菜 单 、 滚 动 条 以 及 窗口 之 间 的 移动 
可 能 在 用 户 面前 会 呈现 出 不 同 的 显示 效果 。 因 此 ， 例 如 ， 尽 管 苹果 公司 的 和 版 Mac 操作 系 
统 是 构建 在 UNIX 内 核 上 的 , 但 是 其 窗口 管理 器 看 起 来 和 工作 起 来 却 更 像 以 前 版 本 的 Mac 
操作 系统 。 另 外 ， 让 窗口 管理 器 作为 外 部 组 件 的 缺点 是 可 能 会 存在 多 种 不 同 的 图 形 化 用 户 界 
面 ， 故 而 需要 为 每 种 图 形 化 用 户 界 面 定制 相应 的 教材 和 培训 资料 。 尽 管 这 对 个 人 来 说 可 能 无 
关 紧 要 ， 但 是 对 于 各 种 机 构 来 说 ， 则 是 一 个 很 大 的 问题 ， 因 为 它们 必须 要 考虑 和 支持 可 能 选 
择 不 同 管理 器 的 许多 用 户 。 

对 于 UNIX 操作 系统 而 言 ， 这 还 不 是 一 个 仅仅 局 限于 图 形 化 用 户 界 面 的 问题 。 传 统 上 ， 
UNIX 命令 一 般 通过 在 一 个 文本 式 命令 解释 器 ( command interpreter) 或 外 过 程序 ( shell， 或 
称 为 命令 解释 器 ) 中 按 行 输入 来 提交 给 操作 系统 。UNIX 系统 的 面向 文本 的 外 壳 程 序 是 一 个 
单独 的 外 部 模块 ， 就 像 图 形 化 用 户 界面 一 样 - 在 UNIX 系统 下 ， 拥 有 很 多 类 似 的 命令 解释 器 
(如 表 19-2 所 示 )。 
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表 19-2 面向 UNIX 和 Linux 系统 的 流行 的 命令 解释 器 


TT TT CE 
KSH 源 自 于 美国 电话 电报 公司 的 System V 
TCSH 加 州 大 学 伯克利 分 校 
BASH 最 初 的 UNIX 命令 解释 器 


ASH | "| 语法 类 似 于 RC， 但 采用 Scheme 语义 
ZSH | eshell | Emacs 完全 用 Elisp 实现 的 类 UNIX 外 壳 程 序 
Bourne 支持 CommonLisp 的 命令 解释 器 


不 同 的 命令 解释 器 有 时 只 是 略 有 不 同 ， 但 有 些 命令 解释 器 则 在 可 编程 、 协 助 用 户 补 全 命 
令 、 保 存 和 重用 以 往 命令 等 方面 存在 很 大 的 不 同 。 这 些 差 异 使 得 命令 解释 器 的 选择 成 为 一 个 
非常 个 性 化 的 决定 ， 同 时 也 使 得 咨询 台 工 作 人 员 的 技能 要 求 更 加 复杂 化 ， 并 限制 了 一 个 用 户 
去 帮助 另 一 个 用 户 的 能 力 。 


19.7 网 络 


操作 系统 的 网 络 接口 ( network interface，NET) 模块 提供 了 对 一 些 网 络 标准 和 各 种 网 络 
硬件 的 访问 支持 。 


19.7.1 网 络 分 层 


在 Linux 操作 系统 中 使 用 的 网 络 模型 是 建立 在 标准 的 传输 控制 协议 / 网 际 协 议 (TCP/IP) 
模型 基础 之 上 的 。 鉴 于 物理 接口 是 由 网 卡 (Network Interface Card,NIC， 或 称 为 网 络 接口 卡 ) 
实现 的 ， 所 以 Linux 系统 一 般 会 忽略 物理 层 ， 故 此 有 关 模 型 只 给 出 了 三 个 服务 层 和 应 用 层 ， 
如 图 19-6 所 示 。 其 中 的 三 个 服务 层 也 曾经 在 图 19-4 中 进行 了 描述 。 通 常情 况 下 ， 操 作 系 统 
开发 人 员 会 采取 彼此 完全 隔离 的 方式 来 构建 每 个 网 络 协议 层 。 而 由 此 造成 的 结果 往往 是 ， 相 
关 消 息 在 层 与 层 之 间 的 额外 复制 所 带 来 的 高 开销 ， 因 为 消息 从 一 层 到 另 一 层 ， 可 能 会 多 出 头 
部 或 者 尾部 。Linux 操作 系统 则 通过 以 所 谓 的 套 接 字 缓 冲 区 ( socket buffer，skbuff) 为 消息 
分 配 空间 的 方法 来 避免 此 类 问题 。 套 接 字 缓冲 区 包含 有 若干 指针 ， 分 别 指向 存储 整个 数据 包 
的 连续 内 存 块 中 的 相应 位 置 。 当 数据 从 一 层 传递 到 下 一 层 时 ， 下 层 的 报头 将 会 被 添加 到 数据 
中 ; 同样 ， 当 数据 从 下 层 传 递 到 上 层 的 时 候 ， 下 层 的 报头 将 会 被 剥离 掉 。 在 分 配套 接 字 缓 冲 
区 的 时 候 ，Linux 操作 系统 将 会 计算 包括 数据 包 所 需 的 各 层 报 头 在 内 的 最 大 长 度 的 内 存 需 求 
量 ， 并 且 ， 刚 开始 的 初始 消息 被 放置 在 有 关 缓 冲 区 的 中 间 ， A 
间 。 这 样 ， 当 数据 包 在 层 间 进行 传递 时 ， 仅 需 把 相应 指针 设置 
为 指向 相应 套 接 字 缓 冲 区 的 报头 或 报 尾 的 新 的 开始 位 置 即 可 。 


19.7.2 监听 连接 的 超级 服务 器 


Linux 操作 系统 利用 一 个 称 为 inetd 的 用 于 监听 连接 的 超级 
服务 器 (connection super-server)， 来 监听 被 诸如 超 文本 传输 协 
议 HTTP、 第 三 版 邮局 协议 POP3 和 远程 终端 协议 Telnet 等 公共 
的 网 际 协议 服务 所 使 用 的 众多 端口 。 当 一 个 网 际 协议 数据 包 到 图 19-6 Linux 网 络 层次 模型 
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达 其 中 的 某 个 端口 的 时 候 ，inetd 将 会 启动 所 选 定 的 服务 器 程序 。 对 于 相关 服务 不 经 常 使 用 
的 情形 而 言 ， 这 种 机 制 能 够 更 加 高 效 地 利用 内 存 资源 ， 因 为 特定 的 服务 器 程序 只 有 在 需要 的 
情况 下 才 会 被 加 载运 行 。 与 此 同时 ， 鉴 于 inetd 把 有 关 套 接 字 直接 连接 到 了 对 应 服务 器 进程 
的 标准 输入 stdin 、 标 准 输出 stdout 和 标准 错误 stderr 函数 上 面 ， 所 以 在 相关 应 用 程序 中 其 
至 不 需要 网 络 方面 的 代码 。 但 是 ， 对 于 使 用 较为 频繁 的 协议 来 说 ， 往 往 需要 构建 和 使 用 一 个 
专用 服务 器 来 直接 处 理 有 关 的 服务 器 请 求 。 


19.7.3 Samba 


由 于 Linux 操作 系统 目前 是 存在 于 一 个 由 微软 操作 系统 软件 所 支配 的 世界 中 ， 所 以 有 大 
量 的 精力 被 投入 用 来 实现 Linux 系统 与 微软 产品 的 和 谐 共处 和 协同 工作 。 前 面 我 们 曾 简单 地 
提 有 及 Linux 文件 系统 对 当前 和 以 前 的 微软 文件 系统 格式 的 支持 ， 我 们 还 谈 到 了 Linux 对 一 些 
网 络 协议 所 提供 的 支持 。 不 过 需要 指出 的 是 ， 在 其 间 遗 漏 掉 了 一 个 在 网 络 领域 占据 主导 地 位 
的 服务 器 软件 包 一 一 Samba。 

Samba 是 实现 了 许多 微软 服务 和 协议 的 服务 器 ,包括 服务 器 消息 块 ( Server Message 
Block，SMB ) 协议 、 通 用 互联 网 文件 系统 ( Common Internet File System，CIFS) 协议 、 分 
布 式 计算 环境 /远程 过 程 调用 ( Distributed Computing Environment/Remote Procedure Call， 
DCE/RPC)、 微 软 远程 过 程 调用 (Microsoft Remote Procedure Call，MSRPC)、Windows 网 
络 命名 服务 ( Windows Internet Name Service，WINS) 的 服务 器 (是 一 种 网 络 基本 输入 / 输 
出 系统 命名 服务 器 ， 即 NetBIOS Name Server，NBNS)、 建 立 在 传输 控制 协议 和 网 际 协议 
基础 上 的 网 络 基本 输入 /输出 系统 协议 (NetBIOS over TCP/IP，NBT)、 网 上 邻居 协议 ( Net- 
work Neighborhood protocol)、 包 含有 NT 域 登 录 的 NT 域 协 议 (NT Domain protocol)、 安 
全 账户 管理 器 ( Secure Accounts Manager，SAM) 数据 库 、 本 地 安全 授权 机 构 (Local Security 
Authority，LSA) 服务 、NT 风格 打印 服务 ( NT-style printing service) SPOOLSS 、NT 局 域 网 
管理 器 (NT LAN Manager，NTLM) 以 及 使 用 Kerberos 和 轻 量 级 目录 访问 协议 ( Lightweight 
Directory Access Protocol，LDAP) 的 活动 目录 (Active Directory) 登录 。 同 时 ，Samba 还 使 
用 这 些 协 议 来 查看 和 共享 包括 打印 机 等 在 内 的 本 地 资源 。 

Samba 可 以 为 选 定 的 Linux 目录 (包括 子 目 录 ) 建立 网 络 共享 。 进 一 步 说 ， 相 关 目 录 在 
微软 Windows 操作 系统 用 户 面 前 呈现 为 文件 夹 方式 ， 而 对 于 Linux 操作 系统 用 户 来 说 ， 则 
可 以 挂 载 对 应 共享 文件 系统 或 者 利用 文件 传输 服务 FTP 程序 之 类 的 实用 程序 来 访问 相应 文 
件 。 每 个 目录 可 以 拥有 正常 的 Linux 文件 保护 之 外 的 相应 的 访问 权限 。 另 外 ， 在 大 多 数 其 他 
UNIX 衍生 版 的 操作 系统 上 也 可 以 找到 对 Samba 的 支持 。 


19.8 安全 
19.8.1 Linux 安全 模块 


关于 安全 问题 ，Linux 社区 一 直 存 在 分 歧 。 有 关 分 歧 的 症结 与 安全 社区 自身 关于 如 何 实 
施 安全 方面 的 分 歧 的 事实 存在 一 定 关系 。 关 于 安全 的 一 项 主要 考虑 是 支持 高 等 级 的 安全 往往 
会 牵涉 到 大 量 的 资源 ， 显 然 ， 这 不 仅 包括 诸如 内 存 和 处 理 器 之 类 的 硬件 利用 因素 ， 也 包括 
用 来 构建 和 正确 使 用 有 关 安 全 机 制 的 管理 及 用 户 的 时 间 等 因素 。 为 此 ， 如 果 在 特定 的 系统 安 
装 中 不 需要 高 等 级 的 安全 ， 那 么 就 不 应 当 非 得 耗 用 相关 资源 。 现 在 的 Linux 系统 的 解决 方案 
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是 ,包含 了 一 种 称 为 Linux 安全 模块 (Linux Security Module，LSM) 的 模块 。Linux 安全 模 
块 由 一 系列 钩子 函数 组 成 ， 而 特定 的 安全 实现 可 以 挂 到 相应 的 钧 子 函数 上 ， 以 便 在 对 象 访问 
时 执行 授权 检查 。 

当前 ， 有 若干 不 同 的 安全 系统 已 被 设计 成 是 利用 Linux 安全 模块 钧 子 机 制 而 运行 在 
Linux 操作 系统 上 。 最 知名 的 是 SELinux ( Security-Enhanced Linux，Linux 安全 增强 模块 )， 其 
提供 了 基于 个 人 请 求 访问 的 信任 (许可 ) 级 别 的 安全 访问 控制 机 制 。 其 他 的 还 包括 AppArmor 
(Application Armor， 应 用 程序 盔甲 式 访问 控制 系统 )、Linux Intrusion Detection System 
(Linux 人 侵 检测 系统 )、BSD Secure Levels (伯克利 软件 发 行 版 安全 分 级 系统 ) 以 及 CIPSO 
(Commercial IP Security Option， 商 业 网 际 协议 安全 选项 )。 对 于 Linux 2.6 版 内 核 而 言 ， 这 
些 模 块 没有 哪 一 个 能 够 对 其 他 模块 形成 压倒 性 的 优势 ， 因 此 ， 相 应 的 Linux 安全 模块 方法 继 
续 得 到 了 支持 。 


19.8.2 网络 安 全 


因为 Linux 操作 系统 的 内 核 源 码 是 免费 提供 的 ， 所 以 对 于 无 论 安全 分 析 人 士 还 是 黑客 来 
说 ，Linux 通常 都 被 用 作 首选 的 操作 系统 。 故 此 ，Linux 操作 系统 拥有 许多 工具 可 用 来 实施 
黑客 行为 和 安全 保护 。 

端口 扫描 程序 ( port scanner) 是 用 来 尝试 确定 目标 计算 机 上 正在 运行 着 哪些 服务 的 软件 
包 。 一 般 而 言 ， 它 们 将 会 尝试 建立 到 达 目 标 机 器 上 的 每 个 可 能 的 端口 的 连接 。 根 据 有 关 尝 
试 的 结果 ， 黑 客 就 可 能 判断 出 对 应 机 器 是 否 容易 从 已 知 漏洞 入手 来 展开 攻击 。 端 口 扫描 程序 
可 以 被 设置 成 是 攻击 单 台 机 器 、 一 组 机 器 或 者 某 个 网 络 上 的 所 有 机 器 。 有 许多 软件 包 能 够 执 
行 端口 扫描 功能 。Nmap ( Network mapper， 网 络 映射 器 )、SATAN ( Security Administrator 
Tool for Analyzing Networks， 网 络 分 析 安 全 管理 员工 具 )、ISS 和 SAINT 是 一 些 较为 知名 的 
端口 扫描 软件 。 

另外 还 有 隐 式 端口 扫描 器 ( stealth port scanner) 。 隐 式 端 口 扫描 器 利用 低级 接口 来 创建 
传输 控制 协议 或 用 户 数据 报 协议 的 数据 包 ， 且 有 关 数 据 包 并 不 正确 遵循 相应 的 协议 。 例 如 ， 
一 个 设置 了 确认 标志 位 ( ACK) 的 传输 控制 协议 数据 包 往往 可 能 成 功 通过 一 个 对 数据 包 进 行 
过 滤 的 防火 墙 ， 因 为 有 关 数 据 包 看 起 来 就 像 是 已 建立 连接 的 一 部 分 。 如 果 在 与 发 送 方 没有 建 
立会 话 的 端口 上 接收 到 这 样 的 数据 包 ， 那 么 相关 的 传输 控制 协议 软件 将 会 以 适当 的 消息 予以 
响应 ， 于 是 黑客 便 可 以 由 此 推断 出 目标 机 器 上 存在 某 个 进程 正在 读 取 相 应 的 端口 。 

tcpd (TCP Wrapper， 即 传输 控制 协议 包装 器 ， 或 称 为 传输 控制 协议 包装 程序 ) 用 来 针对 
在 Linux 或 其 他 类 UNIX 操作 系统 上 运行 的 网 际 协议 服务 的 网 络 访问 进行 过 滤 。 在 超级 服务 
器 (如 inetd) 对 网 际 协议 服务 进行 启动 的 时 候 ， 系 统 会 调用 传输 控制 协议 包装 程序 来 检查 相 
应 连接 的 来 源 。 进 一 步 说 ， 传 输 控 制 协议 包装 程序 支持 根据 主机 或 子 网 的 网 际 协 议 地 址 或 名 
称 进 行 过 滤 。 此 外 ， 相 关 网 际 协议 服务 也 可 以 被 链接 到 认证 (ident) 服务 上 。 后 者 将 会 首先 
查询 传输 控制 协议 (TCP) 端口 113 上 的 网 际 协议 源 地 址 ， 并 期 待 得 到 一 条 关于 标识 对 应 源 
系统 的 查询 应 答 。 只 有 在 接收 到 相应 应 答 并 且 与 数据 库 匹 配 成 功 的 前 提 条 件 下 ， 才 会 允许 建 
立 连接 。 大 多 数 的 网 络 服务 程序 可 以 直接 链接 和 使 用 有 关 实 现 了 相应 过 滤 功 能 的 库 函 数 。 这 
种 方法 可 适用 于 那些 没有 由 超级 服务 器 启动 就 运行 起 来 的 服务 ， 或 者 是 任何 处 理 多 个 连接 的 
服务 。 在 其 他 的 情况 下 ， 只 有 第 一 次 连接 尝试 才 会 通过 传输 控制 协议 包装 器 进行 相应 数据 库 
的 匹配 检查 。 
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19.9 对 称 多 处 理 


在 对 称 多 处 理 系 统 中 ， 操 作 系 统 可 以 在 多 个 处 理 器 上 同时 运行 。 正 如 第 6 章 所 提 到 的 ， 
当前 正在 运行 的 操作 系统 的 两 个 (或 多 个 ) 实例 必须 通过 锁 机 制 的 利用 来 防止 它们 同时 更 改 
相同 的 数据 结构 。 早 期 版 本 的 Linux 操作 系统 的 对 称 多 处 理 支 持 采 用 了 单一 的 锁 来 实现 整个 
内 核 的 锁定 ， 称 之 为 大 内 核 锁 ( Big Kernel Lock)。 然 而 ， 这 种 机 制 并 不 是 非常 高 效 ， 因 为 
在 很 多 时 候 操作 系统 的 不 同 实例 根本 不 会 操作 和 处 理 相 同 的 数据 结构 。 为 此 ， 后 来 的 Linux 
内 核 版 本 已 经 开始 把 对 大 内 核 锁 的 那些 引用 替换 成 为 对 更 多 的 局 部 锁 ( localized lock) 的 引 
用 。 当 然 ， 对 于 大 内 核 锁 的 某 些 引用 仍然 在 Linux 2.6 版 内 核 中 有 所 保留 ， 但 是 多 处 理 器 的 
性 能 却 比 以 往 的 内 核 版 本 大 大 地 提高 了 。Linux 内 核 还 把 自 旋 锁 用 到 了 一 种 特殊 的 读 写 类 型 
的 信号 量 上 ， 以 允许 多 个 读 操 作 进程 同时 执行 读 操作 ， 但 却 只 允许 一 个 写 操作 进程 执行 写 操 
作 ， 而 且 相 关 结 构 在 大 多 数 情况 下 主要 执行 的 是 读 操作 。 例 如 ， 网 络 设 备 表 很 少 会 发 生 改 
变 , 但 其 读 取 操作 却 十 分 频繁 ， 因 此 允许 多 个 读 操作 进程 同时 读 是 大 有 好 处 的 。 于 是 ， 当 需 
要 对 网 络 设备 表 进 行 更 改 的 时 候 ， 可 以 在 仅 由 一 个 写 操作 进程 执行 更 改 操作 的 同时 ， 短 暂 地 
不 准许 所 有 的 读 操 作 进 程 执行 读 操作 。 显 然 ， 这 并 非 经 常会 出 现 的 情况 ， 也 不 会 对 系统 性 能 
造成 多 大 的 不 利 影响 。 


19.10 ”其 他 Linux 操作 系统 变种 


由 于 Linux 操作 系统 内 核 源码 很 容易 就 可 以 得 到 ， 所 以 存在 若干 出 于 某 些 特殊 目的 而 构 
建 起 来 的 Linux 衍生 版 操作 系统 。 其 中 特别 是 集中 在 实时 应 用 领域 的 实时 Linux 操作 系统 版 
本 以 及 面向 有 限 资源 的 小 型 系统 中 的 向 入 式 Linux 操作 系统 版 本 。 


19.10.1 实时 Linux 操作 系统 


通常 的 Linux 操作 系统 并 不 是 硬 实时 操作 系统 (hard real-time OS)， 其 实 对 于 大 多 数 的 
操作 系统 都 是 如 此 。 硬 实时 系统 应 当 确保 满足 实际 的 截止 时 间 ， 例 如 ， 某 个 进程 或 线程 应 当 
在 接 下 来 的 50ms 内 运行 。 硬 实时 系统 排除 了 传统 操作 系统 演化 发 展 而 形成 的 诸多 机 制 ， 特 
别 是 那些 使 用 随机 技术 和 试图 为 各 个 进程 公平 地 提供 服务 的 相关 机 制 。 硬 实时 系统 需要 为 事 
件 及 所 请 求 的 服务 设立 截止 时 间 ， 而 正常 的 操作 系统 机 制 不 会 允许 我 们 提供 这 样 的 截止 时 间 
支持 。 骨 和 人 式 应 用 也 很 重要 ， 其 间 计 算 机 更 像 是 一 台 设 备 中 的 控制 部 件 ， 而 不 是 通用 的 计算 
工具 ， 此 类 明 入 式 应 用 通常 也 是 实时 系统 。 这 意味 着 ， 骨 入 式 Linux 操作 系统 的 实现 和 实时 
Linux 操作 系统 的 实现 之 间 存 在 着 相当 大 的 重 倒 。 

关于 如 何在 Linux 操作 系统 内 核 的 基础 上 构建 实时 系统 的 问题 ， 主 要 存在 两 派 思 路 。 首 
先 ， 某 些 实时 Linux 操作 系统 的 实现 利用 一 个 小 型 的 实时 操作 系统 ( Real-Time OS，RTOS ) 
作为 主机 操作 系统 ， 同 时 让 某 一 版 本 的 Linux 内 核 作为 单个 线程 以 后 台 或 空闲 进程 级 别 的 优 
先 级 运行 在 主机 操作 系统 内 核 上 面 。 换 名 话说 ， 当 没有 任何 实时 进程 运行 的 时 候 ， 任 何 正常 
的 Linux 应 用 程序 都 可 以 在 系统 中 运行 。 这 种 模型 被 称 为 RTLinux。 男 一 派 也 使 用 Linux 内 
核 ， 但 对 其 进行 了 大 幅度 地 修改 ， 以 使 其 仅仅 包含 允许 支持 实时 应 用 程序 接口 的 相关 调度 机 
制 。 有 关机 制 至 少 应 当 包 括 进 程 调 度 器 和 磁盘 调度 程序 ， 可 能 还 有 网 络 协议 栈 。 这 种 实时 应 
用 程序 接口 (Real-Time Application Interface) 模型 也 称 为 RTAI。 自 然 地 ， 除 了 这 两 种 方法 
之 外 ,还 有 其 他 的 一 些 无 法 融和 人 这 两 种 类 型 的 令 人 关注 的 方法 。 弓 庸 置疑 ， 要 决定 某 个 项 目 
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应 当选 用 哪 一 个 正确 的 软件 包 可 能 相当 复杂 。 幸 运 的 是 , 已 经 有 一 套 开 源 的 实时 Linux 通用 
应 用 程序 接口 ( real-time Linux common API)， 其 允许 程序 设计 人 员 在 使 用 无 论 RTLinux 还 
是 RTAI 模 型 时 ， 均 可 按照 该 通用 应 用 程序 接口 来 进行 编码 。 此 外 ， 表 19-3 列 出 了 Linux 操 
作 系 统 的 一 些 戏 人 式 和 实时 系统 的 实现 版 本 。 
表 19-3 常见 的 Linux 衍生 版 操作 系统 
商业 平台 

FSMLabs 公司 : RTLinuxpro 一 一 RTCore， 一 种 让 Linux 作为 空闲 线程 运行 的 硬 实时 平台 

Lineo Solutions 公司 : uLinux 一 一 硬 实 时 Linux 内 核 ， 针 对 消费 者 电子 设备 

LynuxWorks 公司 : BlueCat ( 蓝 猫 ) 一 一 时 序 要 求 严 格 的 中 断 处 理 及 其 他 硬件 操作 控制 ， 以 线程 方式 实现 Linux 内 核 


MontaVista Software 公司 : Linux 的 实时 解决 方案 一 一 面向 振 人 式 和 实时 应 用 的 MontaVista Linux ， 包 含有 一 
个 可 抢占 式 的 Linux 内 核 


Concurrent Computer 公司 : RedHawk ( 红 座 ) 一 一 面向 多 处 理 器 系统 的 基于 Linux 的 RTOS 实时 操作 系统 内 核 ， 
使 用 了 处 理 器 屏蔽 ( CPU shielding) 技术 ， 处理 器 可 以 被 指定 为 把 Linux 反锁 在 外 的 模式 ， 从 而 使 硬 实时 进程 运 
行 在 受到 保护 的 处 理 器 上 ， 并 确保 中 断 的 响应 时 间 


REDSonic 公司 : REDICE-Linux 一 一 具有 额外 的 抢占 时 刻 点 的 实时 Linux 内 核 ， 提 供 实 时 应 用 程序 接口 RTAI 
支持 和 服务 质量 (Quality of Service，QoS) 保证 


TimeSys 公司 : TimeSys Reservations 一 一 利用 动态 安装 的 内 核 模块 对 一 个 Linux 实时 操作 系统 RTOS 进行 了 扩 
展 。 同 时 为 特定 的 进程 或 进程 集 保留 有 固定 数量 的 处 理 器 和 网 络 带 宽 


开源 实现 
Accelerated Technology 一 一 为 嵌入 式 开 发 人 员 提供 实时 操作 系统 (RTOS) 


”ADEOS 一 提供 了 一 个 硬件 抽象 层 ， 人 允许 实时 内 核 和 通用 内 核 共存 。 支 持 双 内 核 的 硬 实时 Linux 环境 ( 警 如 
无 技术 专利 的 RTLinux 或 RTAI1) 


ART Linux 一 一 Linux 2.2 内 核 的 实时 扩展 版 
Flight Linux 一 一 面向 航天 器 使 用 而 设计 的 实时 Linux 衍生 版 
KURT (The KU Real-Time Linux) 一 一 在 堪萨斯 大 学 开发 的 实时 Linux 内 核 


Linux/RK 一 一 对 Linux 进行 了 基于 可 加 载 内 核 模块 的 “资源 内 核 ”功能 增强 ， 可 为 应 用 程序 提供 及 时 、 有 保证 
和 强制 的 对 系统 资源 的 访问 。 开 发 基地 在 卡 内 基 梅 隆 大 学 


OnCore's Linux for Real-Time 一 一 允许 嵌入 式 设 计 人 员 选 择 适合 相应 问题 的 内 存 占 用 和 性 能 模型 
RED-Linux 一 一 Linux 的 实时 版 本 ; 总 部 设 在 加 州 大 学 尔 湾 分 校 


RTAI 一 一 实时 应 用 程序 接口 ， 一 种 可 适用 于 单 处 理 器 和 对 称 多 处 理 系统 的 综合 的 实时 应 用 程序 接口 。 人 允许 从 
用 户 空间 控制 实时 进程 - 利用 细 粒 度 进程 调度 的 软 实时 。AtomicRTAI 是 它 的 一 个 小 型 ( 单 软盘 ) 版 本 


RTLinux 一 一 “ 硬 实时 ”微型 操作 系统 ， 以 其 最 低 优 先 级 且 可 抢占 用 户 线程 方式 来 运行 Linux， 因 此 实时 线程 
和 中 断 处理 程 序 决 不 会 被 非 实时 操作 延迟 。 支 持 用 户 级 实时 程序 设计 。MiniRTL 是 它 的 一 个 小 型 版 本 


RedIce Linux 一 一 RedIce Linux ( 红 冰 Linux) 允许 同时 运行 RTAI 和 RED-Linux， 通 过 完整 的 Linux 内 核 支持 ， 
使 极 低 延迟 要 求 的 实时 任务 和 硬 实时 用 户 应 用 程序 可 以 在 同一 结构 下 运行 


19.10.2 骨 入 式 Linux 操作 系统 


Linux 操作 系统 内 核 也 被 修改 用 来 运行 在 资源 受 限 的 平台 上 。 此 类 平台 包括 在 Palm 操 
作 系 统 相 关 章 节 中 所 讨论 的 那些 平台 ， 同 时 也 包括 像 微 波 炉 和 家 庭 供 暖 控制 器 等 用 户 环境 非 
常 受 限 的 设备 。Linux 的 开源 和 模块 化 特性 使 其 成 为 此 类 场合 的 理想 选择 。 然 而 ， 在 这 样 的 
系统 中 使 用 Linux 作为 操作 系统 必须 要 解决 许多 问题 : 
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e。 首先 ， 相 关 设 备 通常 没有 辅助 存储 器 ， 故 而 实际 上 并 不 需要 分 页 内 存 。 但 是 标准 的 
Linux 操作 系统 往往 假定 存在 辅助 存储 器 。 因 此 ， 在 人 腐 人 式 Linux 系统 中 经 常见 到 的 
一 项 修改 就 是 去 除 分 页 内 存 硬件 支持 需求 。 同 时 ， 相 关系 统 常 常 也 不 需要 缓存 管理 
系统 或 者 如 内 存 映 射 文件 之 类 的 功能 。 

e 其 次 , 极其 受 限 的 用 户 界面 也 值得 注意 ， 因 为 Linux 操作 系统 并 没有 把 图 形 化 用 户 
界面 作为 首要 需求 。 相 反 ， 图 形 化 用 户 界面 是 一 个 附加 组 件 ，Linux 系统 的 标准 接口 
是 命令 行 。 而 对 于 有 关 显 示 装 置 可 能 只 是 仅仅 能 够 显示 几 位 数字 的 液晶 显示 器 面板 
的 微波 炉 来 说 ， 其 至 这 样 的 假设 都 可 能 有 点 过 分 。 当 然 ， 还 有 一 些 嵌 入 式 Linux 系 
统 存 在 于 诸如 小 型 路 由 器 之 类 的 复杂 设备 中 ， 而 相关 设备 现在 通常 支持 超 文本 传输 
协议 ， 并且 可 以 通过 远程 浏览 器 来 进行 管理 。 

。 通常 情况 下 ，Linux 操作 系统 中 的 进程 调度 采用 “交互 性 ”( interactiveness) 的 概念 
来 提升 有 关 与 用 户 交 互 的 进程 的 优先 级 。 但 在 嵌 人 式 系统 中 ， 并 不 存在 精心 设计 的 
交互 式 用 户 界面 。 常 常 可 能 只 有 一 个 小 的 显示 屏 和 几 个 按钮 ， 利 用 一 些 实时 进程 或 
普通 的 中 断 处 理 程序 便 足以 管理 得 非常 到 位 。 因 此 ， 进 程 调度 器 可 以 是 采用 未 引入 
动态 优先 级 改变 的 精简 版 本 。 


19.11 小 结 


作为 实际 操作 系统 实例 研究 部 分 的 一 章 ， 本 章 继续 展示 有 关系 统 是 如 何 实 现 标 准 的 操作 
系统 功能 的 。 进 一 步 说 ， 本 章 重 点 讨论 了 多 用 户 操作 系统 Linux 的 相关 功能 。 具 体 而 言 ， 我 
们 首先 讨论 了 进程 调度 机 制 ， 接 下 来 从 支持 潜在 的 诸多 用 户 创建 各 种 不 同 的 进程 的 角度 出 
发 ， 概 要 说 明了 有 关 操 作 系统 虚拟 内 存 管 理 的 基本 框架 。 然 后 ， 我 们 概述 了 Linux 操作 系统 
中 的 文件 支持 以 及 由 于 Linux 系统 的 不 寻常 的 发 展 历程 而 支持 的 各 种 不 同 的 文件 系统 ， 接 着 
我 们 还 阐述 了 有 关 操 作 系 统 所 提供 的 输入 /输出 功能 。 其 后 ， 我 们 依次 简要 论述 了 Linux 操 
作 系统 中 图 形 化 用 户 界 面 实现 、 网 络 支 持 和 安全 保护 以 及 多 处 理 器 支持 的 相关 话题 。 最 后 ， 
我 们 讨论 了 一 些 Linux 衍生 版 的 操作 系统 ， 而 相关 系统 版 本 的 形成 往往 是 立足 于 那些 通常 情 
况 下 Linux 等 操作 系统 不 常见 到 的 诸如 硬 实时 和 骨 入 式 之 类 的 环境 。 
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19.1 对 于 Linux 2.6 版 内 核 而 言 ， 重 新 设计 进程 调度 器 的 具体 目标 是 什么 ? 
19.2 在 Linux 调度 器 中 ， 实 时 进程 队列 是 以 先进 先 出 方式 进行 调度 的 。 这 是 否 正确 ? 
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简要 描述 对 称 多 处 理 负载 均衡 。 

Linux 操作 系统 使 用 了 标准 的 请 求 分 页 虚拟 内 存 管 理 器 。 这 是 否 正确 ? 

什么 是 伙伴 系统 ? 

Linux 操作 系统 仅仅 提供 了 一 个 从 MINIX 派生 来 的 简单 的 文件 系统 。 这 是 否 正 确 ? 

Linux 操作 系统 的 主要 贡献 之 一 是 其 使 用 了 在 其 他 操作 系统 中 所 没有 的 独特 的 磁盘 调度 算法 。 这 
是 否 正确 ? 

Linux 操作 系统 是 如 何 为 属于 不 同 用 户 的 文件 提供 保护 的 ? 

在 Windows NT 系列 操作 系统 中 ,图形 化 用 户 界 面 是 操作 系统 内 核 所 固有 的 。 那 么 ， 在 Linux 
操作 系统 中 ， 又 是 如 何 提供 图 形 化 用 户 界面 的 ? 

在 通过 网 络 体系 结构 的 各 层 之 间 传 递 消息 时 ，Linux 操作 系统 如 何 防止 过 多 的 缓冲 区 复制 ? 

在 多 处 理 器 系统 上 ，Linux 内 核 可 以 同时 在 多 个 处 理 器 上 执行 。 当 内 核 必须 进入 临界 区 时 ， 它 不 
能 调用 和 召唤 “操作 系统 ” 停 下 来 等 待 ， 因 为 它 本 身 就 是 操作 系统 。 那 么 它 是 如 何 做 的 呢 ? 
实时 操作 系统 具有 某 些 被 大 多 数 操作 系统 所 忽略 的 时 间 安 排 要 求 。 目 前 存在 许多 商业 的 和 开源 
的 Linux 衍生 版 操作 系统 。 我 们 描述 了 两 种 不 同 的 方法 来 支持 Linux 系统 的 实时 需求 。 其 中 ， 
一 种 方法 涉及 大 幅度 修改 Linux 内 核 的 进程 调度 模块 ， 而 另 一 种 方法 则 在 概念 上 更 为 清晰 和 简 
单 。 请 简要 描述 相关 方法 。 

什么 是 大 内 核 锁 ? 它 遭 遇 到 了 什么 现实 状况 ?又 是 如 何 应 对 的 ? 
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20.1 概述 


在 第 4 章 ， 我 们 曾 讨论 了 Palm 操作 系统 的 功能 特征 和 基本 组 成 。 不 过 ,那些 讨论 主要 
限于 当时 我 们 研究 该 操作 系统 相对 于 以 前 所 研究 操作 系统 的 更 复杂 的 设计 目标 而 面临 的 问 
题 。 本 章 基 本 上 阐述 的 是 第 5 版 之 前 的 Palm 操作 系统 。 该 系统 代表 了 本 教材 在 第 二 部 分 所 
描述 的 操作 系统 体系 中 某 个 特定 的 层次 位 置 。 故 而 ， 关 于 这 种 操作 系统 ， 可 以 加 以 论述 且 尚 
未 在 第 4 章 做 过 介绍 的 内 容 已 不 算 很 多 了 。 为 此 ， 在 我 们 按照 与 其 他 两 个 实例 分 析 相 类 似 的 
脉络 依次 展开 各 节 内 容 的 同时 ， 我 们 将 着 眼 于 提供 一 些 与 第 4 章 不 相关 的 细节 。 同 时 ， 考虑 
到 当前 该 操作 系统 的 不 断 发 展演 化 ， 也 会 加 入 一 些 有 助 于 实现 该 操作 系统 在 计算 机 产业 界 中 
进行 定位 的 其 他 材料 。 此 外 ， 我 们 还 将 就 此 类 平台 的 程序 设计 以 及 产业 界 正在 开发 的 应 用 系 
统 的 发 展 趋势 展开 讨论 。 

在 这 一 章 ， 我 们 将 首先 在 第 20.2 节 简 要 重 述 Palm 操作 系统 设计 的 应 用 场景 及 环境 类 
型 。 然 后 ， 从 第 20.3 节 到 第 20.5 节 将 简要 概括 第 4 章 的 相应 的 要 点 。 接 下 来 ,在 第 20.6 
节 ， 我 们 将 讨论 Palm 操作 系统 在 输入 /输出 子 系统 领域 超越 我 们 曾经 在 第 4 章 所 介绍 基本 
功能 的 若干 进展 ， 它 们 形成 了 新 型 手持 式 平台 的 典型 的 功能 特征 。 甚 后， 在 第 20.7 节 和 第 
20.8 节 中 ,我 们 还 是 就 第 4 章 的 相应 内 容 进行 整理 和 概述 。 在 第 20.9 节 则 阐明 对 于 受 限 环 
境 进 行程 序 开发 所 需要 的 交叉 开发 系统 的 主要 类 型 。 另 外 ， 个 人 数字 助理 、 手 机 、 多 媒体 播 
放 器 原先 属于 不 同类 型 的 设备 ， 然 而 ， 这 些 平 台 目 前 正在 进行 整合 。 因 此 ， 在 第 20.10 节 将 
讨论 在 相关 平台 上 的 软件 的 演化 发 展 ， 同 时 也 会 涉及 Palm 操作 系统 在 更 高 版 本 的 一 些 进 展 。 
最 后 ,我 们 在 第 20.11 节 对 全 章 内 容 进 行 归纳 总 结 。 


20.2 ”多 进程 操作 系统 环境 


在 第 4 章 ， 我 们 讨论 了 Palm 操作 系统 及 其 运行 环境 。 但 为 了 方便 起 见 ， 我 们 在 这 里 简 
要 回顾 一 下 。Palm 操作 系统 专 为 一 个 非常 特殊 类 型 的 环境 而 设计 。 这 种 环境 具有 几 方 面 的 
特点 ， 在 一 定 程 度 上 将 会 制约 和 影响 有 关 操 作 系 统 的 设计 方案 。 表 20-1 中 罗列 了 相关 环境 
的 若干 主要 特征 。 

比较 小 的 屏幕 尺寸 ( screen size) 对 Palm 操作 系统 的 设计 影响 尤为 突出 。 其 意味 着 用 户 
每 次 只 能 与 一 个 程序 交互 ， 而 应 用 程序 则 被 假定 为 相应 窗口 始终 填 满 整个 屏幕 ( 主 窗口 前 面 
可 能 弹出 的 小 提示 框 除外 )。 

尽管 后 来 的 模型 有 时 会 包含 磁盘 驱动 器 ， 主 要 是 作为 一 项 附加 的 功能 。 但 是 ， 最 初 的 机 
器 并 没有 包括 此 类 设备 ， 所 以 有 关 操 作 系 统 被 设计 成 假定 所 有 程序 都 驻 留 在 主 内 存 的 情况 。 
同时 ， 缺 少 键盘 意味 着 操作 系统 必须 得 提供 手写 识别 ， 对 应 功能 是 一 个 实时 应 用 程序 ， 故 而 
一 个 实时 的 内 核 构 成 了 Palm 操作 系统 的 基础 。 然 而 ， 用 户 应 用 程序 并 不 是 实时 的 ， 而 且 是 
单线 程 的 。 最 终 形成 的 操作 系统 的 一 系列 设计 选择 结果 如 表 20-2 所 示 。 
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表 20-1 Palm 平台 的 与 众 不 同 的 特性 表 20-2 Palm 操作 系统 的 与 众 不 同 的 特性 
小 屏幕 尺寸 程序 永远 不 会 停止 
没有 辅助 存储 器 没有 请 求 分 页 (虚拟 内 存 ) 或 磁盘 缓存 
没有 硬 键盘 一 一 触摸 屏 单 窗口 图 形 化 用 户 界面 
功率 有 限 ， 主 要 为 了 延长 电池 寿命 多 种 文本 输入 选项 
处 理 器 速度 较 慢 ， 目 的 在 于 降低 功 耗 实时 操作 系统 任务 、 非 实时 应 用 程序 
有 限 的 主 存 空间 没有 多 线程 应 用 程序 


20.3 Palm 进程 调度 
20.3.1 实时 任务 


Palm 操作 系统 的 进程 调度 程序 采用 抢占 式 多 任务 优先 级 调度 策略 。 它 将 动态 地 确定 哪 
一 个 就 绪 任 务 具 有 最 高 优先 级 ， 同 时 将 会 中 断 一 个 不 太 重要 的 任务 的 运行 ， 而 去 执行 一 个 已 
经 准备 就 绪 的 更 重要 的 任务 。 底 层 的 操作 系统 是 一 个 支持 手写 识别 (handwriting recognition ) 
的 实时 内 核 。 但 是 ， 用 户 应 用 程序 是 无 法 访问 这 些 功 能 的 。 手 写 识 别 划分 为 两 个 部 分 : 手写 
笔 跟踪 (stylus tracking) 和 字符 识别 ( character recognition ) 。 手 写 笔 跟踪 利用 标准 中 断 机 制 
来 处 理 源 自 于 手写 笔 的 中 断 。 当 手写 笔 跟踪 确认 手写 笔 改 变 了 方向 、 停 了 下 来 或 者 不 再 触及 
屏幕 ( 即 离开 屏幕 ) 时 ， 就 会 计算 一 个 用 来 描述 相应 移动 操作 的 向 量 ， 并 将 此 消息 传递 给 另 
一 个 正在 运行 的 任务 一 一 字符 (涂鸦 ) 识别 器 。 如 果 该 例 程 可 以 识别 有 关 字 符 ， 将 会 给 操作 
系统 传递 消息 ， 以 便 让 操作 系统 决定 如 何 处 理 相应 字符 。 通 常情 况 下 ， 该 字符 最 后 将 被 传递 
给 持 有 焦点 且 焦点 放置 在 用 户 输入 文本 所 在 的 当前 窗 体 的 控件 上 的 那个 应 用 程序 。 当 然 ， 有 
关 字 符 也 可 能 是 一 个 控制 字符 ， 而 不 是 文本 字符 ， 于 是 应 用 程序 将 会 得 到 关于 对 应 事件 的 一 
条 消息 。 如 果 手 写 笔触 及 屏幕 的 位 置 不 在 涂鸦 区 域内 ， 那么 操作 系统 必须 要 检测 触及 点 是 否 
在 窗 体 按钮 上 或 者 将 有 关 信 息 传递 给 对 应 的 应 用 程序 一 一 比如 说 ， 或 许 这 就 是 一 个 绘图 工具 
软件 。 


20.3.2 ”其 他 任务 


只 有 一 个 单 用 户 的 应 用 程序 持 有 焦点 ， 而 且 有 关 应 用 程序 很 可 能 正在 等 竺 用户 输 入 ， 正 
如 刚才 所 描述 的 那样 。 但 是 ， 在 正常 情况 下 ，Palm 系统 往往 会 拥有 后 台 通 信 功 能 来 执行 诸 
如 电话 、 数 据 库 同 步 、 蓝 牙 到 耳机 等 本 地 设备 的 连接 以 及 网 络 浏览 和 电子 邮件 之 类 的 互联 网 
访问 。 此 外 ， 特 定 的 用 户 功能 ， 比 如 搜索 名 称 ， 将 会 触发 在 当前 没有 持 有 焦点 的 应 用 程序 范 
围 内 的 一 次 搜索 功能 。 一 般 来 说 ， 没 有 持 有 焦点 的 任务 将 会 运行 在 一 个 事件 循环 中 ， 以 等 竺 
有 关 要 求 其 执行 某 种 操作 的 事件 的 信号 。 还 有 ，Palm 调度 程序 应 确保 每 个 应 用 程序 都 能 获 
得 时 间 来 完成 相应 的 工作 。 


20.4 Palm 内 存 管理 


对 于 Palm 操作 系统 而 言 ， 相 关 进 程 始 终 驻 留 在 主 内 存 ( primary memory， 简 称 主 存 或 
内 存 ) 中 。 一 个 进程 一 旦 开始 运行 ， 就 永远 不 会 真正 停止 。 期 间 ， 它 可 能 会 失去 焦点 ， 从 某 
种 意义 上 来 说 ， 它 不 再 运行 。 但 是 ， 它 仍然 存在 于 相应 的 等 待 再 次 被 从 菜单 上 选中 进而 恢复 
执行 的 队列 中 。 
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Palm 操作 系统 的 内 存 管理 器 把 一 大 块 主 存 作为 堆 来 进行 处 理 。 当 内 存在 堆 上 进行 分 配 
和 回收 时 ， 最 终 往往 会 造成 许多 的 外 部 碎片 。 这 便 需 要 偶尔 的 紧凑 处 理 ， 从 而 将 碎片 聚集 成 
比较 大 的 内 存 块 。 为 了 方便 有 关 操 作 ， 内 存 中 相关 各 项 内 容 通过 一 张 内 存 指针 表 〈Memory 
Pointer Table，MPT) 来 间接 寻 址 。 故 而 ， 当 内 存 管 理 器 移动 某 项 内 容 时 ， 仅 仅 需要 更 新 对 
应 的 内 存 指 针 表 表 项 并 使 其 指向 该 项 内 容 即 可 。 有 关机 制 具 体 曾 在 第 4 章 进行 过 详细 介绍 ， 
在 此 不 再 歼 述 。 


20.5 文件 支持 


在 Palm 操作 系统 程序 设计 人 员 的 文档 中 常常 会 提 到 “数据 库 ”， 但 其 实际 上 就 是 随机 访 
问 的 平坦 型 文件 。 它 们 通过 一 个 16 位 整数 的 “索引 ” 值 来 进行 访问 。 相 关 记 录 是 可 变 长 度 
的 ， 并 且 可 以 动态 地 调整 大 小 、 添 加 和 和 删除。 有关 文 件 管理 器 维护 着 每 个 数据 库 的 索引 ， 给 
出 相应 数据 库 中 每 条 记录 在 内 存 的 当前 位 置 。 需 要 强调 的 是 ， 一 个 数据 库 必须 完 完整 整地 存 
储 在 单 块 存储 卡 内 。 


20.6 输入 / 输出 子 系统 


早期 的 Palm 设备 仅仅 被 用 作 个 人 数字 助理 。 正 如 曾经 提 到 的 那样 ， 经 过 不 断 的 演化 和 
发 展 ， 这 些 系统 已 经 拥有 了 游戏 、 手 机 、 万 维 网 浏览 器 (Web browser， 或 称 为 网 络 浏览 器 )、 
媒体 播放 器 ( media player) 等 许多 附加 的 功能 。 客 观 地 说 ， 最 初版 本 的 Palm 操作 系统 功能 
确实 十 分 有 限 ， 特 别 是 在 音频 方面 ， 然而， 相关 方面 通过 各 种 版 本 的 不 断 改 进 已 经 得 到 了 显 
著 的 提高 。 此 外 ， 从 通信 和 网 络 功能 的 进步 也 可 以 看 出 有 关乎 台 的 发 展 变化 。 本 节 将 讨论 音 
频 功 能 ， 而 网 络 功能 我 们 将 会 放 在 后 面 的 小 节 来 进行 介绍 ， 以 保持 与 其 他 实例 研究 章节 结构 
的 一 致 性 。 


20.6.1 音频 输入 / 输出 


技术 的 持续 发 展 使 人 们 对 便携 式 音乐 设备 的 兴趣 越 来 越 浓 厚 。 同 时 ， 用 户 和 希望 在 这 
些 机 器 上 拥有 的 高 级 游戏 往往 也 需要 增强 的 音频 功能 ， 特 别 是 音频 输入 /输出 (Audio 1/ 
O) 功能 。 最 初 ，Palm 操作 系统 对 音频 的 支持 仅仅 限于 长 度 较 短 的 警报 声 和 游戏 中 的 一 
些 噪声 。 在 后 来 的 版 本 中 ， 则 添加 了 乐器 设备 接口 (Musical Instrument Device Interface， 
MIDI) 的 低级 实现 ， 这 样 就 可 以 由 应 用 程序 去 创建 更 加 精致 的 乐 声 。 于 是 在 此 基础 上 产生 
了 许多 有 趣 的 应 用 程序 ， 璧 如 乐音 发 生 器 ( tone generator) 和 节拍 器 ( metronome)， 以 支持 
音乐 演奏 人 员 把 Palm 操作 系统 设备 当 作 一 个 简单 的 音乐 工具 。 该 平台 的 后 期 版 本 还 增加 了 
更 先进 的 声音 支持 ， 人 允许 相应 设备 作为 手机 以 及 进行 音乐 文件 的 播放 。 再 后 来 ， 还 增加 了 
录音 和 回放 的 功能 一 一 录制 和 回放 自己 的 声音 一 一 以 及 音频 录制 和 将 音频 发 送 到 其 他 的 手 
机 上 。 


20.6.2 流 输 入 /输出 


为 了 方便 程序 的 设计 ，Palm 操作 系统 还 包含 有 对 文件 流 ( file stream) 的 支持 ， 类 似 于 
大 多 数 C 语言 库 所 提供 的 标准 输入 流 (stdin) /标准 输出 流 ( stdout) 功能 。 相 关 功 能 使 用 了 
前 面 在 20.5 节 所 讨论 到 的 数据 库 结构 ， 但 允许 一 些 应 用 程序 可 以 更 加 方便 地 移植 到 Palm 操 
作 系 统 上 。 


20.6.3 ”内 存 型 磁盘 驱动 程序 


有 关 底 层 操 作 系 统 是 按照 通常 没有 辅助 存储 器 的 垦 入 式 系统 的 应 用 场景 而 设计 的 。 但 
是 ,许多 应 用 程序 则 是 按照 从 标准 文件 系统 风格 的 接口 运行 而 开发 的 。 为 此 ，AMX 操作 系 
统 ( 译 者 注 : 一 种 实时 操作 系统 ， 在 这 里 用 作 底 层 操 作 系 统 ) 配备 了 一 个 预定 义 的 内 存 型 磁 
盘 (RAM disk， 或 称 为 随机 存 取 存 储 器 型 磁盘 或 RAM 磁盘 ) 驱动 程序 ， 利 用 一 部 分 随机 存 
取 存 储 器 来 模拟 磁盘 驱动 器 。 这 样 就 能 够 使 Palm 操作 系统 轻而易举 地 来 定义 一 个 作为 DOS 
格式 化 软盘 驱动 器 的 随机 存 取 存储 器 驱动 器 (RAM drive)， 从 而 使 应 用 程序 可 以 更 方便 地 
移植 到 Palm 操作 系统 上 ， 而 且 程序 员 也 无 须 为 了 有 关系 统 的 使 用 而 专门 去 学 习 一 个 单独 的 
接口 。 


20.6.4 照相 机 


伴随 低 成 本 、 高 分 辩 率 的 互补 金属 氧化 物 半导体 (Complementary Metal Oxide Semi- 
conductor，CMOS) 图 像 传感器 技术 的 发 展 ， 如 今 许多 的 手机 和 个 人 数字 助理 都 包含 了 相机 
( camera， 或 称 为 照相 机 ) 部 件 及 功能 。 同 时 ， 鉴 于 现在 有 了 更 大 容量 的 内 存 ， 所 以 有 关 相 
机 不 仅 可 以 拍摄 静态 图 像 ， 甚 至 还 可 以 录制 视频 文件 。 因 此 ， 相 关 设备 目前 除了 能 够 传输 音 
频 文件 ， 还 能 传输 图 像 文件 和 视频 文件 。 


20.6.5 ”通信 电路 


当前 ， 随 着 蓝牙 和 802.11 无 线 保 真 ( Wireless Fidelity，Wi-Fi) 通信 电路 的 上 市 推广 ， 
最 新 版 的 Palm 设备 已 经 包含 了 相应 模块 和 功能 。 它 们 不 但 允许 其 他 同步 的 途径 ,而 且 还 推 
动 了 个 人 数字 助理 和 手机 设备 类 型 以 及 互联 网 接 入 设备 的 相互 融合 ， 比 如 黑莓 ( Blackberry) 
手机 就 是 例证 。 


20.7 图 形 化 用 户 接口 编程 


关于 Palm 平台 的 图 形 化 用 户 接口 环境 ， 我 们 在 第 4 章 已 经 进行 过 广泛 的 论述 。 辨 别 有 
关乎 台 的 主要 因素 就 是 屏幕 尺寸 小 且 内 存 有 限 。 因 为 屏幕 比较 小 ， 所 以 Palm 系统 并 不 支持 
应 用 程序 窗 体 (form) 的 重 春 。(Palm 操作 系统 使 用 术语 “ 窗 体 ”来 称谓 普通 的 窗口 。 dele 
这 个 平台 允许 从 单个 应 用 程序 中 触发 弹出 框 (pop-up box) 的 显示 。 不 过 ， 接 下 来 在 对 应 
应 用 程序 继续 运行 之 前 ， 必 须 先 要 关闭 这 些 弹 出 框 ( Palm 操作 系统 称 这 些 框 为 “窗口 ” " 
pe Palm 系统 有 限 的 内 存 空间 决定 了 可 以 由 Palm 应 用 程序 创建 的 特定 的 窗口 的 开发 模式 ， 

也 只 能 是 仅仅 填写 特定 的 数据 结构 和 调用 操作 系统 例 程 而 已 。 其 后 ， 当 用 户 选 定 某 个 选项 
时 ， 有 关 操 作 系 统 将 承担 显示 窗口 和 关闭 窗口 的 任务 。 


20.8 网 络 编程 


20.8.1 个 人 数据 同步 


当然 ， 便 携 式 设备 应 当 对 通信 协议 给 予 强 有 力 的 支持 。 鉴 于 Palm 设备 一 开始 的 设想 是 
作为 个 人 数字 助理 ， 所 以 其 最 重要 的 通信 应 用 就 是 与 个 人 计算 机 之 间 的 同步 ， 这 样 手 持 设备 
的 数据 就 能 够 实现 备份 。 故 而 ，Palm 操作 系统 提供 的 初始 接口 是 关于 串口 (serial port)、 红 
外 端口 (infrared port) 以 及 通用 串 行 总 线 端口 (USB port) 的 低级 别 的 驱动 程序 。 同 时 ， 还 
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提供 有 一 个 更 高 级 别 的 接口 ， 用 于 编写 应 用 程序 来 同步 个 人 信息 ， 壁 如 联系 人 列表 ( contact 
list) 和 约会 日 历 ( appointment calendar)。 为 此 ， 组 建 了 一 个 利益 相关 的 供应 商 联合 会 ， 称 
之 为 Versit Consortium ( Versit 联合 会 ) 。 他 们 定义 了 一 套 关 于 个 人 数据 交换 ( Personal Data 
Interchange，PDI) 的 标准 ， 包 括 电 子 名 片 (electronic business card) 交换 格式 标准 vCard 
以 及 电子 日 历 和 日 程 安排 交换 格式 标准 vCalendar。 现 在 ， 这 些 标 准 由 互联 网 邮件 协会 
(Internet Mail Consortium ) 来 负责 维护 。Palm 操作 系统 还 包含 有 一 个 库 ， 用 来 支持 应 用 程序 
以 读者 或 写 者 方式 打开 个 人 数据 交换 流 ， 以 方便 有 关 同 步 功 能 的 应 用 程序 的 开发 。 


20.8.2 ”其 他 数据 同步 


一 些 用 户 经 常 关注 于 定制 式 应 用 程序 的 开发 ， 且 有 关 应 用 程序 往往 超出 了 传统 的 个 
人 数字 助理 设备 上 的 应 用 程序 的 范畴 。 进 一 步 说 ， 他 们 可 能 拥有 特定 的 数据 文件 ， 并 需要 
在 Palm 应 用 程序 和 其 他 平台 上 的 类 似 应 用 程序 之 间 进 行 同步 。 为 此 ，Palm 操作 系统 提供 
了 交换 库 ( exchange library)， 作 为 所 谓 交 换 管理 器 ( Exchange Manager) 的 操作 系统 模块 
的 插件 。 这 种 机 制 支持 Palm 操作 系统 中 的 应 用 程序 在 导 人 和 导出 数据 记录 时 无 须 关 心 相 
应 的 传输 机 制 。 例 如 ， 一 个 常常 提供 给 Palm Powered 手持 式 设备 的 交换 库 就 实现 了 红外 
开发 商 协会 (Infrared Developers Association，IrDA) 的 协议 ， 即 红外 对 象 交换 (Infrared 
OBject EXchange，IrOBEX) 协议 。 这 样 便 允许 应 用 程序 通过 红外 线 方式 把 对 象 从 一 个 Palm 
Powered 手持 式 设备 播送 到 男 一 个 Palm Powered 手持 式 设备 上 。 对 于 其 他 的 硬件 端口 和 其 
他 的 协议 ， 也 存在 类 似 的 交换 库 ， 壁 如 短信 服务 ( Short Message Service，SMS) 库 、 电 子 
邮件 协议 以 及 蓝牙 库 等 。 


20.8.3 互联 网 应 用 程序 


在 过 去 的 几 年 中 ， 互 联网 已 经 非常 普及 ， 甚 至 于 几乎 是 强制 性 的 要 求 手持 式 设备 能 够 访 
问 其 间 可 以 发 现 的 许多 流行 功能 ， 特 别 包 括 万 维 网 ( World Wide Web，WWW) 网 站 以 及 我 
们 刚才 提 到 的 电子 邮件 协议 。 于 是 ， 更 多 的 协议 栈 和 应 用 程序 接口 被 添加 到 了 Palm 操作 系 
统 中 来 支持 网 络 应 用 程序 及 互联 网 应 用 程序 。 第 一 项 被 加 入 的 是 被 广泛 使 用 的 众所周知 的 低 
级 的 伯克利 套 接 字 ( Berkeley socket) 应 用 程序 接口 。 该 接口 允许 程序 设计 人 员 利 用 各 种 协 
议 连 接 到 其 他 系统 上 的 相关 服务 上 ， 而 无 须 在 应 用 程序 中 实现 相应 协议 。 该 接口 的 包含 使 得 
Palm 操作 系统 可 以 支持 传输 控制 协议 (面向 连接 的 ) 通信 或 者 用 户 数 据 报 协议 (无 连接 的 ) 
通信 。 

Palm 操作 系统 支持 的 第 二 级 协议 包括 对 应 用 层 协 议 的 支持 ， 璧 如 用 于 万 维 网 的 超 文本 
传输 协议 (HyperText Transport Protocol，HTTP)，Palm 设备 的 万 维 网 浏览 器 和 万 维 网 服务 
应 用 程序 便 用 到 了 这 一 协议 。 当 开发 Palm 设备 的 浏览 器 时 ， 有 一 些 值 得 关注 的 问题 需要 解 
决 ， 因 为 最 初 几乎 没有 网 站 是 按照 手持 设备 的 非常 小 的 屏幕 空间 的 设想 而 开发 的 。 尽 管 如 
此 ， 当 前 的 超 文本 传输 协议 属性 支持 万 维 网 服务 器 来 判定 浏览 器 是 否 运行 在 移动 平台 上 ， 并 
进而 调整 相应 的 输出 样式 来 适应 屏幕 的 大 小 。 


20.8.4 电话 应 用 程序 


在 第 20.10 节 ， 我 们 将 讨论 目前 的 个 人 数字 助理 设备 与 移动 电话 之 间 的 融合 。Palm 系 
统 的 电话 管理 器 ( Telephony Manager) 提供 了 一 组 允许 应 用 程序 访问 各 种 电话 服务 的 功能 函 
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数 。 电 话 应 用 程序 接口 (telephony API) 按照 所 谓 服务 集 ( service set) 的 分 组 对 这 些 函 数 进 
行 组 织 。 每 一 个 服务 集 包 含 一 组 相关 的 功能 函数 ， 这 些 功 能 函数 有 可 能 在 某 个 特定 的 移动 设 
备 或 网 络 上 能 够 支持 ,但 到 了 男 一 个 设备 或 网 络 上 就 不 再 支持 。 其 中 还 有 一 个 应 用 接口 函数 
是 用 来 支持 有 关 应 用 程序 去 确认 当前 环境 中 是 否 支 持 给 定 的 服务 集 的 。 一 些 比较 常见 的 服务 
集 如 表 20-3 所 示 。 


表 20-3 ”电话 应 用 程序 接口 服务 集 


服 务 集 功 能 
基本 功能 服务 集 始终 提供 和 可 用 的 功能 
配置 功能 服务 集 包括 短信 服务 在 内 的 手机 配置 
数据 功能 服务 集 数据 呼叫 处 理 
紧急 呼叫 功能 服务 集 紧急 呼叫 处 理 
信息 功能 服务 集 有 关 当 前 手机 的 信息 检索 
网 络 功能 服务 集 下 


设备 制造 商 (Original Equipment 
Manufacturer，OEM) 功能 服务 集 


电话 秒 功 能 服务 集 访问 用 户 身份 模块 (Subscriber Identity Module，SIM) 和 地 址 短 
电源 功能 服务 集 关于 电源 供应 级 别 的 相关 功能 
为 电话 和 SIM 卡 安全 相关 功能 提供 PIN (了 Personal Identification Number， 


允许 制造 商 为 电话 管理 添加 功能 ， 并 为 设备 提供 新 的 功能 服务 集 


安全 功能 服务 集 个 人 身份 号 码 ， 在 这 里 专 指 相关 密码 ) 管理 和 相关 服务 
短信 服务 功能 服务 集 启用 短信 的 读 取 、 发 送 和 删除 功能 
声音 功能 服务 集 手机 声音 管理 ， 包 括 按键 音 和 静音 的 处 理 
og 处 理 语音 呼叫 的 发 送 和 接收 ， 还 包括 双 音 多 频 ( Dual-Tone Multi-Fre- 
语音 通话 功能 服务 集 quency，DTMEF) 信号 的 处 理 
20.9 编程 环境 


按照 有 关 设 计 用 来 运行 Palm 操作 系统 的 计算 机 上 的 可 用 资源 ， 通 常 无 法 支撑 相关 软件 
的 开发 。 为 此 ，Palm 操作 系统 编程 网 站 建议 ， 基 于 Palm 系统 所 设计 的 程序 只 能 支持 最 低 数 
量 的 数据 项 。 这 一 建议 在 一 定 程度 上 是 考虑 到 手写 识别 输入 的 难度 ， 同 时 也 是 因为 非常 有 限 
的 屏幕 显示 尺寸 。 另 外 ，Palm 公司 建议 有 关 用 户 应 当主 要 在 桌面 系统 上 输入 数据 ， 并 利用 
Palm 系统 来 引用 相关 数据 。 还 有 ， 一 旦 一 个 程序 运行 在 了 Palm 操作 系统 上 ， 往 往 就 不 会 有 
简单 方便 的 途径 来 支持 实现 任何 调试 信息 的 显示 ， 显 然 这 样 的 环境 并 不 适合 程序 源 代码 的 输 
入 和 编辑 。 进 一 步 说 ， 几 乎 没有 打印 机 会 连接 到 Palm 系统 上 ， 而 且 正 如 之 前 所 提 到 的 ， 一 
般 情 况 下 ， 其 处 理 器 运行 速度 很 慢 ， 随 机 存 取 存 储 器 空间 也 很 有 限 ， 并 且 往 往 不 会 配备 辅助 
存储 器 。 因 此 ， 大 多 数 的 程序 开发 都 是 在 另 一 个 系统 上 完成 的 ， 称 为 跨 平 台 开 发 。 

有 各 种 语言 和 工具 可 用 来 支持 Palm 操作 系统 的 软件 开发 。 其 中 ， 有 一 些 是 由 Palm 公 
司 自身 提供 的 ， 而 另外 一 些 则 是 由 第 三 方 提供 的 ， 璧 如 由 Metrowerks 公司 提供 的 Code- 
Warrior 等 商用 的 集成 开发 环境 (Integrated Development Environment，IDE) 以 及 一 些 免 
费 的 工具 ， 例 如 PRC 工具 一 一 一 种 基于 gcce 的 采用 C/C++ 语言 来 构建 Palm 操作 系统 应 用 
程序 的 编译 器 工具 链 。 由 Palm 公司 提供 的 工具 如 Software Development Kit (软件 开发 工 
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具 ,，SDK)， 具 体 包 括 头 文件 、 函 数 库 以 及 一 些 在 Windows、Linux 和 Mac 操作 系统 上 用 作 
Palm 操作 系统 开发 平台 的 工具 。 同 时 ， 该 软件 开发 工具 还 包括 一 个 以 原生 x-86 代码 运行 在 
Windows 系统 设备 上 的 Palm 操作 系统 的 版 本 。 这 种 模拟 机 制 提供 了 一 种 简单 的 方法 来 测试 
面向 Palm 操作 系统 而 开发 的 应 用 程序 的 兼容 性 。 除 此 之 外 ， 还 有 一 些 编译 器 用 来 支持 利用 
包括 VB、Pascal、Forth、Smalltalk 和 Java 等 在 内 的 其 他 语言 来 开发 应 用 程序 。 

被 Palm 公司 称 为 Emulator (仿真 器 ) 的 软件 包 拥 有 非常 重要 的 功能 。 该 软件 包 可 以 在 
Windows、Linux 或 者 Mac 操作 系统 的 计算 机 上 仿真 Palm 操作 系统 平台 上 的 各 种 型 号 的 硬 
件 设备 。 鉴 于 不 同 的 平台 往往 在 其 只 读 存储 器 内 部 提供 不 同 的 功能 ， 所 以 只 读 存 储 器 镜像 就 
被 Palm 操作 系统 仿真 器 用 来 仿真 每 种 所 期 望 的 硬件 设备 型 号 。 

一 旦 通过 跨 平 台 工 具 开 发 完成 了 一 道 程序 ， 该 程序 就 可 以 通过 针对 Palm 个 人 数字 助理 
而 为 各 种 交叉 开发 平台 提供 的 同步 工具 安装 到 Palm 设备 上 。 


20.10 类似 系统 和 当前 发 展 状况 


计算 机 科学 方面 的 作者 所 面临 的 一 项 困难 是 ， 有 关 行 业 的 发 展 变化 非常 迅猛 ,一 本 书 往 
往 无 法 反映 行业 的 最 新 发 展 ， 哪 怕 只 是 到 其 印刷 出 版 的 那 一 天 的 进展 情况 。 操 作 系统 也 不 例 
外 。Palm 操作 系统 以 及 在 这 一 章 所 提 及 的 其 他 同类 系统 所 使 用 的 硬件 系统 已 经 发 生 了 日 新 
月 异 的 飞速 发 展 。 此 外 ， 一 种 不 同 的 功能 视图 已 经 俘获 了 大 众 用 户 和 供应 商 的 想法 ， 并 驱使 
有 关 操 作 系 统 进行 某 些 调整 和 改变 。 于 是 ， 按 照 这 种 不 同 视图 开发 的 其 他 操作 系统 便 拥有 了 
比 这 里 所 描述 的 Palm 操作 系统 更 为 复杂 的 某 些 功能 。 当 然 ， 后 来 的 Palm 操作 系统 版 本 也 
跟着 增加 了 相应 的 功能 特征 。 

在 本 节 中 ， 我 们 将 会 讨论 面向 小 微 系统 的 其 他 操作 系统 中 可 以 见 到 的 一 些 功 能 。 我 们 通 
常会 提 到 塞 班 操作 系统 (Symbian OS)。 该 操作 系统 由 塞 班 公司 ( Symbian Ltd) 所 开发 ， 是 
佩 森 公司 (Psion) 的 EPOC 操作 系统 ( 译 者 注 : EPOC 一 词 源 自 于 “a new epoch of personal 
convenience”， 即 个 人 便利 设备 的 新 纪元 ) 的 衍生 版 ， 只 能 运行 在 ARM ( 译 者 注 : Advanced 
RISC Machines 或 Acorn RISC Machine， 即 先进 的 精简 指令 集 计 算 机 机 器 ， 而 Acorn 则 是 
ARM 公司 的 前 身 ) 处 理 器 上 。 同 时 ， 塞 班 公司 是 一 家 手机 制造 商 的 联合 企业 。 


20.10.1 新 的 功能 模型 


对 于 小 型 手持 式 系统 来 说 ， 不 仅 采 用 了 更 为 先进 的 处 理 器 ， 而 且 基 本 功能 也 在 过 去 的 几 
年 里 不 断 地 演化 。21 世纪 初 ， 在 这 一 领域 的 产品 还 只 是 大 多 被 想像 为 个 人 数字 助理 或 手机 。 
个 人 数字 助理 中 的 应 用 程序 基本 上 就 是 电话 、 地 址 每 、 约 会 日 历 、 计 算 器 、 备 忘 录 、 待 办 
事项 、 专 业 数 据 库 以 及 偶尔 的 专业 应 用 程序 。 而 手机 中 的 主要 应 用 程序 则 是 电话 短 ( phone 
book) 或 通讯 录 (contact list)。 无 论 哪 种 情况 ， 相 关 应 用 程序 都 是 独立 的 ， 当 然 ， 偶 尔 也 需 
要 连接 到 另 一 台 计 算 机 来 进行 同步 、 备 份 或 者 是 加 载 新 的 应 用 程序 。 在 手机 中 ,真正 的 电话 
应 用 程序 是 一 个 实时 的 任务 ， 被 认为 是 有 关 设 备 的 基本 功能 ， 而 不 是 一 个 单独 的 应 用 程序 。 
从 额外 应 用 程序 的 安装 并 非 有 关 设 计 方 案 组 成 部 分 的 角度 来 说 ， 这 些 手机 都 是 封闭 式 系统 。 

然而 ， 近 来 , ,针对 手持 式 设备 的 一 种 新 的 模型 已 经 演化 形成 。 这 种 演变 发 生 的 原因 在 一 
定 程 度 上 是 由 于 通信 技术 可 用 性 的 革命 以 及 无 所 不 在 连通 可 用 的 巨大 变革 。 相 关 设 备 现在 已 
被 定位 为 移动 通信 平台 ,但 不 再 仅仅 是 手机 的 替代 品 。 将 手机 和 个 人 数字 助理 区 别 开 来 的 主 
要 依据 就 是 : 当 个 人 数字 助理 打开 后 ， 往 往 只 是 使 用 一 些 单一 的 功能 ， 然 后 就 将 其 关闭 ; 而 
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手机 则 通常 在 大 多 数 时 间 都 不 是 通话 状态 〈 即 接 通 状态 )、 但 却 一 直 处 于 连接 网 络 状态 并 等 
竺 来电 。 除 了 等 待 来电 ， 手 机 也 会 完成 管理 连接 等 其 他 工作 ， 璧 如 保持 时 间 同 步 、 与 蜂窝 网 
络 (cellular network) 交互 以 便于 确定 当 手 机 打开 时 其 “ 身 ” 处 何方 。 在 手机 处 理 网 络 连接 
的 同时 ， 为 了 能 够 使 用 个 人 数字 助理 的 功能 ， 这 些 移动 通信 设备 的 操作 系统 必须 可 以 在 同一 
时 间 包 含 多 个 活动 的 任务 。 在 一 个 纯粹 的 个 人 数字 助理 设备 (如 最 初 的 Palm 产品 ) 中 ， 操 
作 系 统一 般 只 会 提供 几 个 独立 的 任务 ， 以 便 让 手写 识别 和 同步 功能 可 以 在 用 户 界 面 ( User 
Interface，UI) 应 用 程序 运行 时 使 用 (或许 你 还 记得 由 于 屏幕 尺寸 过 小 ， 故 而 没有 足够 的 空 
间 来 执行 和 摆 放 多 个 用 户 界面 应 用 程序 )。 尽 管 如 此 ， 其 并 没有 为 应 用 程序 提供 任何 单独 的 
后 台 功 能 ， 比 如 蜂窝 网 络 连接 管理 和 检查 来 电信 息 。 因 此 ， 有 关 操 作 系 统 可 以 添加 更 多 的 功 
能 来 支持 多 线程 应 用 。 更 为 重要 的 是 ， 除 了 独立 的 前 台 用 户 界 面 线 程 ， 应 用 程序 现在 可 以 启 
动 线程 ， 并 作为 后 台 任 务 的 一 部 分 。 利 用 这 一 功能 的 例证 就 是 建立 一 项 服务 同时 处 理 多 个 传 
输 控制 协议 /网 际 协议 的 连接 ， 从 而 让 多 个 基于 传输 控制 协议 / 网 际 协议 的 应 用 程序 都 能 够 
利用 单一 的 传输 控制 协议 / 网 际 协议 多 线程 的 服务 在 同一 时 间 运 行 。 这 样 ， 有 关 传 输 控制 协 
议 /网 际 协议 的 服务 将 作为 一 个 “用 户 ” 应 用 程序 而 不 是 作为 操作 系统 内 核 的 一 部 分 来 运行 。 
另 一 个 重要 的 例子 就 是 万 维 网 浏览 器 。 当 从 服务 器 获取 一 个 页 面 时 ， 相 关 图 像 和 其 他 被 包含 
的 各 项 内 容 并 不 会 被 自动 发 送 。 有 关 浏 览 器 必须 解析 初始 页 面 ， 然 后 逐个 单独 请 求 每 一 项 被 
引用 元 素 。 同 时 ， 在 从 服务 器 获取 其 他 元 素 和 内 容 的 同时 ， 相 应 浏览 货 必 须 能 够 继续 工作 和 
为 用 户 显 示 主 页 面 。 这 样 就 给 用 户 提 供 了 内 容 的 即时 访问 和 更 加 流畅 的 浏览 体验 。 

当 手 机 处 于 接 通 状态 的 情况 下 ， 其 他 无 须 用 户 界面 控制 的 应 用 程序 则 可 以 受益 于 这 些 后 
台 任 务 。 一 些 较为 明显 的 后 台 任 务 ， 如 播放 音频 文件 、 下 载 新 的 音频 文件 来 进行 播放 、 即 时 
通信 (Instant Messaging，IM) 以 及 电子 邮件 程序 连接 到 服务 器 来 查收 新 的 电子 邮件 。 同 时 
也 存在 着 一 些 其 他 的 不 太 明 显 的 后 台 任 务 ， 璧 如 分 布 式 数据 库 的 同步 更 新 以 及 所 安装 软件 的 
升级 更 新 。 这 些 新 的 功能 将 有 助 于 手机 制造 商 将 它们 的 产品 彼此 区 分 开 来 。 此 外 ， 由 于 用 户 
开始 重视 通过 短信 、 电 子 邮件 和 万 维 网 来 即时 访问 信息 ， 所 以 他 们 正在 要 求 这 些 功能 服务 。 
为 了 提供 这 些 功能 ， 相 关 设 备 采 用 了 先进 的 硬件 组 件 来 处 理 多 个 通信 流 、 多 媒体 流 ， 等 等 。 
为 此 ， 操 作 系统 也 必须 加 以 改进 和 完善 。 进 一 步 说 ， 应 用 程序 不 仅 可 以 启动 多 个 线程 ， 并 且 
可 以 为 每 个 线程 设置 不 同 的 优先 级 ， 同 时 还 应 当 设 立新 的 机 制 来 实现 在 线程 之 间 以 及 和 其 他 
进程 之 间 的 同步 、 与 其 他 进程 的 内 存 分 段 的 共享 、 与 其 他 进程 的 通信 以 及 数据 库 的 保护 。 


20.10.2 ”高 级 通信 模型 

就 高 级 通信 模型 而 言 ， 有 关 操 作 系 统 提供 了 包括 加 密 等 安全 机 制 、 新 的 数据 链 路 层 模 
块 (譬如 蓝牙 和 802.11x) 以 及 对 应 的 应 用 程序 接口 等 其 他 先进 通信 机 制 ， 以 方便 新 的 用 户 
应 用 程序 能 够 很 容易 地 访问 相应 的 操作 系统 功能 。 同 时 ， 伴 随 通信 服务 中 带宽 成 本 的 持续 
下 降 ， 我 们 开始 看 到 越 来 越 密集 的 多 媒体 应 用 程序 。 根 据 市 场 短期 预测 ， 流 媒体 ( streaming 


multimedia) 应 用 将 会 日 益 增 多 ， 且 相关 应 用 程序 往往 具有 大 量 的 硬 实时 和 软 实 时 要 求 。 而 
随 着 需求 的 不 断 增加 ， 这 些小 型 的 操作 系统 将 继续 演化 和 发 展 。 


20.10.3 ”线程 调度 


如 前 所 述 ， 手 机 的 使 用 与 个 人 数字 助理 的 使 用 有 些 不 同 。 在 一 般 情况 下 ,个 人 数字 助理 
不 使 用 的 时 候 就 处 于 关闭 状态 ， 但 通常 情况 下 手机 则 一 直 保持 开机 运行 ， 从 而 使 其 可 以 等 竺 
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来 电 ， 并 保证 有 关 网 络 能 够 不 断定 位 和 更 新 对 应 手机 的 位 置 。 男 外 ， 蜂 窝 技术 也 正 是 要 求 这 
样 的 实时 任务 来 为 网 络 提 供 服 务 的 。 因 此 ， 塞 班 操 作 系 统 中 所 使 用 的 调度 程序 就 是 一 个 基于 
优先 级 的 多 线程 调度 程序 ， 任 何 应 用 程序 都 可 以 是 一 个 “服务 器 "， 并 且 可 以 在 其 地 址 空间 
内 创建 多 个 执行 线程 。 类 似 地 ， 鉴 于 涂鸦 式 手 写 识别 程序 的 需要 ， 所 以 Palm 操作 系统 也 包 
括 一 个 实时 调度 程序 ， 不 过 其 用 户 应 用 程序 并 不 能 创建 实时 任务 或 线程 。 我 们 曾经 在 第 8 章 
讨论 过 这 样 的 调度 程序 。 


20.10.4 ”用 户 界 面 参 考 设计 


大 多 数 个 人 计算 机 的 用 户 界面 非常 灵活 ， 相 关 窗 口 不 仅 可 以 填 满 整 个 屏幕 ， 而 且 也 可 以 
缩 为 一 个 较 小 的 尺寸 , 或 者 是 到 处 移动 、 相 互 覆 盖 , 等 等 ， 具 体 取决 于 用 户 的 想法 。 但 是 对 
于 这 些 较 小 的 系统 来 说 ， 则 往往 具有 比 个 人 计算 机 更 为 简单 的 界面 。 通 常情 况 下 ， 有 关 应 用 
程序 假定 自己 的 窗口 会 填 满 整个 屏幕 。 在 对 应 设备 上 ， 通 常 拥有 三 种 不 同类 型 的 用 户 界 面 ， 
大 致 分 别 代 表 了 手机 、 个 人 数字 助理 和 手持 式 计算 机 (handheld computer， 或 称 为 掌上 电脑 ) 
三 种 类 型 。 用 户 界 面 类 ( user interface class) 是 每 种 设备 系列 共同 拥有 的 特征 的 抽象 。 关 于 
相关 用 户 界面 类 的 特性 总 结 如 表 20-4 所 示 。 


表 20-4 ”小 微 系统 设备 系列 









小 尺寸 屏幕 (垂直 方向 ) 
带 有 数字 按键 和 用 个 按钮 的 键盘 
几乎 没有 用 户 输入 

应 用 程序 拥有 整个 屏幕 


大 尺寸 屏幕 (垂直 方向 ) 
手写 笔 输入 和 几 个 按钮 
有 限 的 用 户 数据 输入 

应 用 程序 拥有 整个 屏幕 


大 尺寸 屏幕 (垂直 方向 和 水 平方 向 可 以 转换 ) 
(通常 是 ) 完整 的 标准 传统 键盘 

更 广泛 的 用 户 输入 

应 用 程序 窗口 可 以 相互 重 和 等 











个 人 数字 助理 











高 级 设备 


对 于 操作 系统 设计 人 员 和 应 用 程序 设计 人 员 而 言 ， 所 面临 的 挑战 在 于 ， 所 编写 的 操作 系 
统 和 应 用 程序 可 以 运行 在 上 述 任何 一 种 平台 上 ， 且 无 须 进 行 重 大 的 改动 。 对 这 种 移植 性 的 期 
望 迫使 系统 严格 地 按照 面向 对 象 设 计 来 加 以 实现 ， 以 便于 将 用 户 界 面 功 能 与 应 用 程序 的 其 他 
部 分 相互 隔离 。 据 业内 人 士 估计 ， 一 个 应 用 程序 大 约 有 80% 的 部 分 可 以 与 用 户 界面 分 离开 来 。 

互联 网 的 日 益 普 及 导致 了 相关 新 型 设备 中 若干 标准 应 用 程序 的 建立 。 特 别 地 ， 用 户 希 望 
发 送 即 时 消息 、 处 理 电 子 邮 件 、 欣 赏 (观看 或 聆听 ) 流 媒 体 信 息 、 浏 览 万 维 网 、 上 传 多 媒体 
文件 到 他 们 的 网 站 。 鉴 于 这 些小 微 系 统 的 屏幕 尺寸 非常 有 限 ， 所 以 网 页 通常 也 就 设置 为 至 少 
800X600 像素 。 因 此 ， 一 部 手机 上 的 浏览 器 必须 努力 做 到 可 以 智能 地 显示 一 个 更 大 斥 二 的 
网 页 。 为 了 构建 网 页 以 便 在 手持 式 系统 上 加 以 查看 ， 最 初 还 曾 创立 了 一 个 单独 的 标准 一 一 无 
线 标 记 语 言 ( Wireless Markup Language，WML)， 是 无 线 访 问 协议 ( Wireless Access Protocol， 
WAP) 的 组 成 部 分 。 然 而 ,后 来 的 发 展 似乎 表明 ， 标 准 的 浏览 器 经 过 修改 ， 就 可 以 支持 在 手 
持 式 系统 上 显示 标准 的 万 维 网 网 页 。 不 言 而 喻 ,这 是 一 个 非常 活路 的 研究 领域 。 

另外 还 创立 了 一 个 其 他 的 协议 ， 用 于 在 不 合适 打 电 话 情况 下 的 简短 文本 消息 的 发 送 。 例 
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如 ， 当 接收 者 处 于 一 个 非常 嗜 杂 的 环境 中 (在 演讲 、 艺 术 表 演 或 会 议 上 ) 的 时 候 ， 就 可 能 需 
要 此 类 协议 的 支持 。 同 时 ,信息 技术 在 无 须 复杂 交互 的 场合 也 可 以 被 用 来 实施 短小 的 查询 。 
这 种 协议 就 是 短信 服务 ( Short Message Service，SMS) 协议 ， 其 支持 发 送 长 达 160 字 节 的 
消息 。 短 信服 务 可 以 像 即 时 通信 服务 一 样 用 在 普通 的 个 人 计算 机 中 。 不 过 ， 即 时 通信 通常 情 
况 下 是 交互 性 的 ， 而 短信 服务 则 往往 采用 单 向 消息 方式 。 


20.10.5 ”位 置 感知 类 应 用 程序 


这 些 系统 的 另外 一 个 显而易见 但 却 依然 值得 关注 的 方面 就 是 其 跟着 用 户 四 处 移动 。 相 关 
情况 在 经 过 一 段 时 间 之 后 逐渐 变 得 明朗 化 ， 也 就 是 说 ， 如 果 有 关 应 用 系统 能 够 获悉 手机 的 位 
置 ,那么 就 可 以 构建 一 些 很 有 意思 的 应 用 程序 ， 称 之 为 位 置 感知 类 应 用 程序 。 最 初 的 动力 可 
能 是 已 经 授权 给 了 手机 的 紧急 定位 系统 ( emergency location system)。 在 紧急 情况 下 ， 如 果 
手机 可 以 告知 紧急 呼叫 处 理 部 门 及 相关 人 员 相 应 手机 所 处 位 置 附近 几 十 米 的 范围 ， 显 然 是 大 
有 益处 的 。 

另外 也 可 以 构建 许多 其 他 的 基于 定位 的 应 用 程序 ( location-based application ) 。 鉴 于 在 
美国 的 手机 运营 商 已 被 授权 可 以 使 用 网 络 来 定位 手机 的 位 置 ， 于 是 他 们 便 决 定 从 此 项 授权 里 
面 来 榨取 商业 价值 ， 进 一 步 说 ， 基于 电话 当前 所 处 的 位 置 通过 设计 相关 服务 并 提供 给 他 们 的 
用 户 (当然 要 收取 适当 的 费用 )。 比 如 你 想 知道 ,最近 的 饺子 馆 在 什么 地 方 ?( 译 者 注 : 原 
著 此 处 为 pizza restaurant， 但 pizza 即 比 萨 ， 属 于 意大利 餐饮 ， 和 后 面 的 中 国 餐馆 不 一 致 ， 
故 做 此 修改 。) 于 是 拨打 1411 (或 者 一 些 类 似 的 特定 的 电话 号 码 )， 接 下 来 ， 一 个 态度 友好 的 
接线 员 将 会 从 网 络 中 获取 你 的 位 置 ， 询 问 你 需要 什么 帮助 ， 进 而 从 基于 位 置 索引 的 数据 库 中 
搜索 最 近 的 中 国 和 餐馆 的 位 置 ， 并 将 相关 信息 提供 给 你 。 其 他 常见 的 应 用 还 比如 : 一 般 的 驾驶 
向 导 、 交 通报 告 、 天 气 预报 ， 等 等 。 当 然 ， 这 些 系统 也 可 以 完全 是 计算 机 自动 化 的 ， 即 无 须 
设立 专门 的 操作 人 员 。 

其 间 存 在 的 一 个 很 有 意思 的 问题 是 ， 电 话 〈 或 网 络 ) 如 何 能 够 找到 手机 的 当前 位 置 ? 一 
种 答案 是 利用 联邦 的 全 球 定位 系统 ( Global Position System，GPS)， 其 在 轨道 上 运营 有 几 十 
颗 卫 星 专门 用 来 实现 这 项 功能 。 最 初 ， 它 们 是 为 了 军事 目的 而 部 署 的 ， 但 是 ， 既 然 这 些 卫星 
的 使 用 仅仅 涉及 监听 它们 的 广播 ， 故 而 就 不 可 能 永远 把 民用 排除 在 外 。 通 过 几 颗 卫星 的 同时 
定位 ， 任 何 设备 都 可 以 确定 其 当前 的 位 置 ， 包 括 海拔 高 度 。 这 是 一 种 极其 精确 的 定位 机 制 ， 
在 许多 情况 下 ， 只 有 几 英 尺 的 误差 ( 译 者 注 : 1 英尺 =30.48 厘米 )。 尽 管 如 此 ， 有 关 硬 件 成 
本 相 比 于 手机 大 部 分 其 余部 件 仍然 有 些 高 。 幸 运 的 是 ， 另 外 还 有 至 少 两 种 方法 也 可 以 找到 电 
话 的 位 置 。 其 一 是 通过 网 络 对 手机 进行 三 角 定位 。 所 有 能 够 捕捉 到 手机 信号 的 蜂 窜 基 站 都 会 
报告 来 自 手 机 的 信号 的 时 间 ， 于 是 有 关 网 络 就 可 以 由 此 实现 手机 定位 ,误差 在 一 百 英 尺 左右 
的 范围 内 。 对 于 汽车 驾驶 来 说 ， 这 种 精度 是 不 够 的 ， 但 是 通常 情况 下 这 足以 找到 比如 说 最 近 
的 邮局 。 另 一 种 网 络 定位 机 制 则 仅仅 报告 为 移动 设备 提供 服务 的 那 一 个 蜂窝 基站 的 信息 以 及 
可 能 基于 信和 号 传播 时 间 计 算得 到 的 手机 当前 位 置 到 对 应 信和 号 塔 的 距离 。 虽 然 这 种 方法 相 比 于 
三 角 定 位 而 言 更 不 准确 ， 但 对 于 许多 应 用 场景 来 说 仍然 足够 精确 和 可 以 利用 。 


20.10.6 ”后 来 的 Palm 操作 系统 版 本 


Palm 操作 系统 从 第 5 版 开始 支持 ARM 处 理 器 (ARM processor)， 而 不 再 是 以 前 平台 所 
使 用 的 摩托 罗拉 的 处 理 器 。 同 时 ， 其 从 5.4 版 开始 的 个 人 应 用 集成 ( Personal Application 


邸 20 茧 Palm 所 作 条 统 实例 研究 。 401 


Integration，PAI) 软件 包 被 称 为 Garnet。PalmSource 公司 先是 从 Palm 公司 分 离 出 来 ， 后 又 
被 Access 有 限 公司 ( Access Co. Ltd.) 收购 。 他 们 构建 了 一 版 用 在 移动 平台 上 的 支持 Garnet 
应 用 程序 接口 的 Linux 操作 系统 。Palm 操作 系统 的 最 新 版 本 是 第 6 版 ， 称 为 Cobalt。 


20 于 1 修 结 


在 这 一 章 中 ， 我 们 就 一 种 简单 的 现代 操作 系统 一 一 由 Palm 公司 开发 的 Palm 操作 系 
统一 一 的 功能 特征 和 设计 机 理 展开 了 进一步 的 讨论 。 该 操作 系统 是 针对 小 型 手持 式 设备 而 开 
发 的 。 虽 然 它 是 一 种 单 用 户 系统 ， 但 是 它 可 以 同时 运行 若干 操作 系统 进程 以 及 少量 的 应 用 程 
序 。 我 们 从 有 关 操 作 系 统 的 进程 调度 和 内 存 管 理 功能 出 发 来 开启 本 章 的 内 容 。 然 后 ， 我 们 讨 
论 了 Palm 操作 系统 中 若干 附加 的 输入 /输出 子 系统 、 图 形 化 用 户 接口 编程 和 网 络 编程 ， 并 
就 利用 较 大 型 系统 中 的 模拟 器 和 交叉 编译 器 为 相关 受 限 环境 开发 程序 的 过 程 进 行 了 解释 说 
明 。 随 后 ， 我 们 讨论 了 面向 受 限 环境 的 一 些 类 似 的 操作 系统 以 及 它们 与 Palm 操作 系统 之 间 
的 不 同 ， 也 包括 后 来 的 Palm 操作 系统 版 本 ， 但 其 实际 上 是 一 种 运行 在 另 一 不 同 处 理 器 上 的 
不 同 的 操作 系统 。 另 外 ， 我 们 还 讨论 了 伴随 个 人 数字 助理 和 手机 平台 的 融合 而 出 现 的 一 些 新 
的 应 用 程序 类 型 。 
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习题 

20.1 既然 几乎 没有 网 站 是 基于 160X 160 像素 的 屏幕 大 小 的 假设 而 开发 的 ， 那 么 使 用 超 文本 传输 协议 

又 是 用 来 支持 什么 的 ? 


20.2 ”对 于 Palm 设备 来 说 ， 内 存 型 磁盘 驱动 程序 有 什么 样 的 用 处 ? 

20.3 ”就 本 章 讨论 的 手持 式 平台 上 所 运行 的 程序 来 说 ， 相 关 程 序 设 计 人 员 如 何 着 手 开 展 它 们 的 创建 和 
测试 ? 

20.4 相 比 于 早期 版 本 ，Palm 平台 增 加 了 哪些 新 的 设备 类 型 和 功能 ? 它们 又 推动 了 什么 类 型 的 应 
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20.5 
20.6 
20.7 
20.8 


坑 六 部 分 实例 研 宠 


用 呢 ? 

vCard 是 什么 ? 

什么 是 “位 置 感知 类 应 用 程序 ”? 

请 描述 三 种 不 同类 型 的 手持 式 系统 系列 。 

手机 和 个 人 数字 助理 之 间 的 一 项 主要 区 别 是 : 个 人 数字 助理 往往 是 使 用 时 开机 、 不 用 时 关机 ， 
而 手机 则 通常 大 部 分 时 间 都 处 于 开机 运行 状态 。 基 于 这 一 区 别 ， 针 对 手机 而 设计 的 相关 操作 系 
统 中 加 入 了 什么 主要 功能 呢 ? 


| 附 录 


Operating Systems: A Spiral Approach 


计算 机 系统 总 览 和 体系 结构 概念 





在 本 附录 中 ， 我 们 将 概要 介绍 计算 机 体系 结构 的 相关 概念 ， 重 点 是 那些 与 操作 系统 特别 
相关 的 概念 。 有 些 读者 已 经 选修 过 计算 机 组 织 或 计算 机 体系 结构 方面 的 课程 ， 故 而 会 对 这 些 
概念 比较 熟悉 。 在 这 种 情况 下 ， 附 录 提 供 的 材料 可 作为 复习 使 用 。 对 于 那些 以 往 没 有 学 习 过 
此 类 主题 的 课程 的 读者 ， 则 建议 仔细 地 研读 附录 内 容 ， 因 为 许多 操作 系统 概念 的 讨论 都 是 在 
底层 的 计算 机 体系 结构 的 基础 上 展开 的 。 在 操作 系统 相关 概念 及 设计 机 理 的 整个 陈述 过 程 中 
常常 会 用 到 这 里 给 出 的 概念 。 

我 们 首先 在 第 A.1 节 中 描述 了 典型 计算 机 系统 的 主要 部 件 ， 并 讨论 了 每 种 部 件 所 承担 
和 执行 的 功能 。 然 后 ， 在 第 A.2 节 中 ， 我们 讨论 了 中 央 处 理 器 及 其 控制 原理 。 接 下 来 ， 在 第 
A.3 节 概 述 了 内 存 和 存储 器 体系 的 设计 理念 ， 在 第 A.4 节 描 述 了 输入 /输出 系统 的 基本 概念 ， 
在 第 A.5 节 简 要 讨论 了 网 络 在 现代 计算 中 的 作用 和 特点 。 在 此 基础 上 ， 我 们 在 第 A.6 节 给 出 
了 一 幅 关 于 典型 计算 机 系统 部 件 的 更 详细 的 结构 图 。 最 后 ， 在 第 A.7 节 对 全 部 内 容 进行 了 


总 结 。 


A.1 典型 计算 机 系统 部 件 


根据 功能 和 预期 用 途 ， 计 算 机 系统 彼此 之 间 的 差别 往往 很 大 。 从 这 个 角度 来 说 ， 它 们 可 

划分 为 以 下 几 种 类 型 的 系统 : 

e 个 人 (personal) 台式 计算 机 和 笔记 本 计算 机 (notebook computer， 或 称 为 笔记 本 电 

脑 )， 通 常情 况 下 每 次 只 能 由 单个 用 户 所 使 用 。 

大 型 服务 器 ( server) 计算 机 ， 每 天 为 成 百 上 千 甚 至 成 千 上 万 的 用 户 提供 服务 。 它 们 
包括 存储 万 维 网 文档 的 互联 网 万 维 网 服务 器 ( Web server， 或 称 为 网 站 服务 器 )、 存 
储 大 型 数据 库 的 数据 库 服 务 器 ( database server)、 为 计算 机 网 络 存储 和 管理 文件 的 文 
件 服务 器 ( file server) 以 及 运行 有 关 提 供 了 远程 访问 服务 的 特定 应 用 程序 的 应 用 程 
序 服务 器 (application server)。 

e 藤 入 式 (embedded) 计算 机 系统 ， 用 在 汽车 、 飞 机 、 电 话 、 计 算 器 、 家 用 电器 、 媒 
体 播放 器 、 游 戏 机 、 计 算 机 网 络 部 件 以 及 许多 其 他 这 样 的 设备 中 。 随 着 处 理 器 芯片 
变 得 越 来 越 便宜 ， 我 们 将 会 在 越 来 越 多 的 地 方 看 到 它们 。 在 将 来 ,我 们 甚至 应 当 会 
在 今天 很 难 想象 的 地 方 看 到 它们 。 

。 穿戴 式 移动 (mobile) 设备 、 手 机 ( cell phone， 或 称 为 蜂窝 电话 ) 以 及 用 于 保存 约 
会 日 历 、 电 子 邮 件 、 电 话 笑 和 其 他 信息 的 个 人 数字 助理 ( Personal Digital Assistant， 
PDA)。 今天 ， 这 类 系统 正 变 得 越 来 越 强大 ， 故 而 难以 与 个 人 计算 机 (Personal 
Computer，PC) 区 分 开 来 。 

为 此 ， 很 难 确定 典型 的 计算 机 系统 应 当 是 什么 样子 。 尽 管 如 此 ， 传 统 上 一 致 认为 ， 大 多 

数 的 计算 机 系统 应 具备 三 类 主要 部 件 ， 如 图 A-1 所 示 ， 也 就 是 处 理 器 (processor) 或 中 央 处 
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理 器 、 存 储 器 部 件 (memory unit) 和 输入 /输出 部 件 S。 除 了 这 三 种 主要 部 件 之 外 ， 网 络 设 
备 也 很 重要 ， 其 将 计算 机 系统 连接 在 一 起 ， 并 支持 信息 和 程序 的 共享 。 接 下 来 ， 让 我 们 分 别 
就 每 类 部 件 的 主要 功能 逐一 加 以 简要 的 描述 。 





图 A-1， 计 算 机 系统 结构 简 图 


中 央 处 理 器 ( Central Processing Unit，CPU， 或 称 为 中 央 处 理 单元 ， 或 简称 为 处 理 器 ) 
是 执行 计算 机 系统 所 需 的 计算 和 控制 逻辑 的 电路 。 存 储 器 ( memory) 是 用 来 存储 计算 所 需 
的 数据 和 有 关 执 行 计算 的 实际 命令 的 部 件 。 存 储 器 通常 被 组 织 成 若干 级 别 ， 从 而 形成 关于 
不 同类 型 存储 设备 的 存储 体系 ( storage hierarchy， 或 称 为 存储 器 层次 结构 )， 我 们 将 在 第 
A.3 节 中 详细 描述 。 输 入 /输出 (InputOutput，LO) 部 件 包 括 基于 其 主要 功能 ( 即 输 入 和 
输出 ) 的 两 个 宽泛 的 设备 子 类 。 当 然 ， 某 些 设备 既 可 用 于 输入 ， 也 可 用 于 输出 。 输 入 设备 
(input device) 用 于 从 诸如 只 读 光盘 (CD-ROM ) 或 磁盘 之 类 的 设备 将 数据 和 程序 指令 加 载 到 
存储 器 部 件 中 。 它 们 还 用 于 通过 诸如 键盘 或 指针 式 设备 (例如 ， 鼠 标 或 触摸 板 ) 之 类 的 设备 
来 处 理 来 自用 户 的 输入 命令 。 输 出 设备 (output device) 用 于 通过 诸如 打印 机 或 视频 监视 器 
(video monitor) 之 类 的 设备 为 用 户 打 印 (或 向 用 户 显 示 ) 数据 和 信息 ， 以 及 在 诸如 各 种 类 型 
磁盘 的 辅助 存储 器 (secondary storage) 设备 上 存储 数据 和 程序 。 需 要 指出 的 是 ,诸如 硬盘 驱 
动 器 (hard disk drive) 和 读 写 式 光 盘 (CD-RW) 驱动 器 之 类 的 设备 既 可 用 于 输入 ， 又 可 用 于 
输出 ， 故 而 被 归 为 输入 / 输出 设备 ( input/output device)。 网 络 设 备 也 可 以 被 认为 是 输入 / 输 
出 设备 ， 不 过 其 非常 特别 ， 最 好 还 是 被 认为 是 单独 的 某 类 设备 。 

如 果 我 们 考虑 计算 机 系统 的 低级 硬件 视图 ,那么 一 般 的 磁盘 设备 (硬盘 、 软 盘 、 光 盘 等 ) 
都 应 被 认为 是 输入 /输出 设备 。 而 如 果 我 们 采取 更 概念 化 的 视图 来 看 待 它们 所 承担 的 作用 ， 
即 存储 数据 和 程序 ， 那 么 它们 也 可 以 被 认为 是 计算 机 系统 的 存储 体系 的 组 成 部 分 ， 我 们 将 在 
第 A.3 节 中 加 以 讨论 。 

在 许多 现代 的 计算 机 系统 中 ， 网 络 (network) 是 另 一 类 的 关键 部 件 ， 其 是 支持 现 有 的 数 
百 万 台 计 算 机 和 网 络 设备 实现 彼此 通信 的 硬件 和 软件 。 网 络 可 以 由 电话 线 、 光 纤 和 其 他 类 型 
的 电缆 ， 以 及 卫星 、 无 线 集线器 、 红 外 设备 和 其 他 部 件 而 形成 。 但 是 ， 在 单 台 机 器 级 别 ， 将 
网 络 视 为 另 一 种 类 型 的 输入 /输出 设备 有 时 候 却 是 非常 有 用 的 ， 因 为 其 主要 功能 就 是 从 一 台 
(作为 输出 的 ) 机 器 传送 数据 (诸如 文件 、 文 本 、 图 片 、 命 令 等 ) 到 另 一 人 台 (作为 输入 的 ) 机 
器 。 对 于 计算 机 用 户 来 说 ， 互 联网 是 网 络 的 最 明显 的 例子 。 

接 下 来 的 三 节 将 更 为 详细 地 依次 讨论 处 理 器 、 存 储 器 和 输入 /输出 三 种 主要 的 计算 机 系 


日 ”在 更 详细 的 层面 上 ， 处 理 器 有 时 被 划分 为 两 个 部 分 : 控制 器 (control unit， 或 称 为 控制 单元 ) 和 数据 通路 
单元 (data path unit)， 我 们 将 在 下 一 节 中 具体 展开 讨论 。 类 似 地 ， 输 入 /输出 部 件 有 时 被 分 成 输入 设备 和 
输出 设备 。 
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统 部 件 。 而 网 络 则 放 在 第 A.5 节 中 加 以 讨论 。 


A.2 ”中央 处 理 器 


如 前 所 述 ， 中 央 处 理 器 是 执行 各 种 算术 和 逻辑 运算 的 硬件 电路 。 每 个 处 理 器 应 当 具 有 一 
套 定义 了 可 由 相应 处 理 器 所 执行 的 操作 的 特定 的 指令 集 (instruction set)。 其 中 通常 包括 整 
数 算术 运算 、 比 较 操作 、 传 送 操作 、 控 制 操 作 等 。 同 时 ， 处 理 器 往往 会 拥有 一 组 和 寄存器， 用 
来 保存 正在 执行 的 操作 以 及 对 应 操作 所 需 的 一 些 数据 值 或 操作 数 (operand) 9S。 根据 有 关 指 
令 集 的 设计 ， 也 可 以 直接 从 存储 器 单元 (memory location) 访问 其 他 的 操作 数 。 我 们 在 本 节 
后 面 的 部 分 将 进一步 详细 说 明 寄 存 器 的 使 用 以 及 操作 数 的 类 型 。 

各 种 指令 集 千差万别 。 有 些 处 理 器 是 基于 精简 指令 集 计 算 机 (Reduced Instruction Set 
Computer，RISC) 理念 而 设计 的 ， 仅 仅 在 硬件 中 直接 实现 了 其 中 的 几 种 基本 指令 类 型 ， 因 
为 相关 指令 彼此 在 设计 方面 往往 非 党 类似。 精简 指令 集 计 算 机 的 优点 之 一 是 通过 拥有 一 个 包 
含有 限 指令 类 型 的 集合 来 降低 硬件 的 复杂 性 ， 并 因而 提高 相关 指令 的 执行 速度 。 最 常见 的 精 
简 指令 集 计 算 机 微 处 理 器 是 Alpha 系列 〈 由 惠普 公司 开发 ， 尽 管 不 再 制造 ， 但 在 历史 上 具有 
重大 意义 )、 典 入 式 ARM 处 理 器 、MIPS 、PIC 微 控 制 器 系列 、PowerPC 系列 (由 苹果 公司 、 
IBM 公司 和 摩托 罗拉 联合 开发 ) 以 及 SPARC 系列 (由 太阳 微 系统 公司 开发 )。 

其 他 处 理 器 则 拥有 一 套 直 接 在 硬件 中 实现 的 大 得 多 的 指令 集 ， 其 中 包含 了 各 种 各 样 的 指 
令 类 型 。 这 种 方法 被 称 为 复杂 指令 集 计 算 机 (Complex Instruction Set Computer，CISC ) 。 精 
简 指令 集 计 算 机 处 理 器 通常 具有 30 一 100 条 具有 32 位 固定 指令 格式 的 不 同 指令 ， 而 复杂 指 
令 集 计 算 机 处 理 器 则 往往 拥有 120 一 400 条 不 同 的 指令 。 复 杂 指 令 集 计 算 机 处 理 器 的 例子 如 
IBM 公司 的 System/360、DEC 公司 的 VAX 和 PDP-11、 摩 托 罗 拉 的 68000 系列 以 及 英特尔 
的 基于 x86 架构 的 处 理 器 和 兼容 处 理 器 。 

今天 的 大 多 数 处 理 器 既 不 是 纯粹 的 精简 指令 集 计 算 机 ， 也 不 是 纯粹 的 复杂 指令 集 计算 
机 。 这 两 种 设计 理念 实际 上 都 在 朝 彼 此 方向 演化 发 展 ， 故 而 相关 方法 在 提高 性 能 和 效率 方面 
不 再 具有 了 明确 的 区 别 。 采 用 精简 指令 集 计 算 机 的 各 种 指令 集 的 芯片 增加 了 更 多 的 指令 和 复杂 
性 ， 因 此 现在 它们 与 复杂 指令 集 计 算 机 的 同类 产品 一 样 复杂 ， 而 相关 争论 主要 发 生 在 有 关 的 
营销 部 门 之 间 。 


A.2.1 指令 集体 系 结构 及 机 器 语言 


指令 集体 系 结 构 (instruction set architecture) 定义 了 处 理 器 的 机 器 语言 (machine lan- 
guage)， 而 机 器 语言 就 是 处 理 器 可 以 直接 执行 的 命令 的 集合 。 每 条 指令 被 编码 为 可 以 由 处 理 
器 解码 和 执行 的 二 进 制 位 序列 ， 即 位 串 (bit string)。 指 令 存放 在 存储 器 中 ， 并 且 通 常情 况 下 
按 顺 序 执行 ， 除 非 当 某 些 类 型 的 指令 指定 了 特定 的 控制 转移 操作 (transfer of control) 的 情 
况 下 。 指 令 位 串 被 划分 成 若干 部 分 ， 称 为 字段 ( field)。 尽 管 各 种 指令 格式 相互 之 间 的 区 别 
可 能 很 大 , 但 是 往往 都 包含 有 一 些 典 型 的 字段 ， 具 体 说 明 如 下 : 

e 操作 码 (operation code，opcode) 字段 ， 用 来 指定 要 执行 的 特定 操作 。 

。 修饰 符 字段 (modifier field)， 有 时 被 用 来 区 分 具有 相同 操作 码 和 格式 的 不 同 操作 ， 

日 至 少 在 概念 上 ， 存 储 数据 值 的 寄存 器 也 可 以 被 认为 是 存储 器 层次 结构 的 顶层 (参见 第 A.3 节 )， 因 为 它们 


用 来 保存 数据 并 且 在 被 所 执行 的 指令 访问 时 提供 了 最 快 的 访问 速度 。 当 然 ， 从 物理 上 讲 ， 它 们 是 处 理 器 
芯片 的 组 成 部 分 。 
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例如 整数 加 法 和 减法 。 

e 操作 数字 段 (operand field)， 用 于 指定 每 个 特定 操作 所 需 的 数据 值 或 地 址 。 有 关 地 址 
可 以 是 存储 器 地 址 ， 也 可 以 是 寄存 器 地 址 。 

e 有 许多 不 同类 型 的 操作 数 ， 而 用 来 解释 每 种 类 型 的 操作 数 的 含义 的 方式 称 为 寻 址 方 
式 (addressing mode)。 我 们 可 以 区 分 两 种 主要 类 型 的 操作 数 。 第 一 种 类 型 提供 了 操 
作 所 需 的 数据 值 (data value) 或 数据 值 的 地 址 (address of a data value) 。 第 二 种 类 型 
提供 了 指令 的 地 址 (address of an instruction ， 或 称 为 指令 地 址 )， 其 一 般 在 通过 分 支 
操作 (branch operation ) 或 跳 转 操作 (jump operation ) 来 改变 指令 执行 顺序 的 情况 下 
才 会 使 用 。 

关于 数据 (data) 操作 数 ， 最 常见 的 几 种 寻 址 方式 说 明 如 下 : 

e 寄存 器 寻 址 (register addressing) : 对 应 操作 数 指定 了 用 来 存储 有 关 操 作 所 需 的 或 所 
生成 的 数据 的 寄存 器 的 地 址 。 

e 立即 寻 址 (immediate addressing) : 对 应 操作 数 就 是 包含 在 相应 指令 位 串 本 身 某 一 字 
段 中 的 直接 的 数据 值 。 

e 基 址 寄存 器 寻 址 (base register addressing) : 对 应 操作 数 存 放 在 存储 器 单元 中 ， 并 

且 该 存储 器 单元 的 地 址 应 通过 将 基 址 寄存 器 ( base register ; 其 包含 有 一 个 用 作 参 照 

的 存储 器 单元 的 地 址 ) 的 内 容 和 位 移 量 ( displacement) 或 偏 移 量 ( offset) 相 加 来 计 

算 获 得 。 有 关 位 移 量 可 以 是 指令 本 身 中 所 包含 的 直接 的 数值 ， 也 可 以 是 另 一 个 寄存 

器 中 所 包含 的 数值 ， 在 后 一 种 情况 下 把 相应 的 另 一 寄存 器 称 为 索引 寄存 器 (index 

register) 。 

间接 寻 址 ( indirect addressing) : 如 果 要 用 作 操 作 数 的 数据 的 存储 器 地 址 被 存放 在 

一 个 寄存 器 或 另 一 个 存储 器 单元 中 ， 则 称 之 为 间接 寻 址 。 因 为 有 关 指 令 并 没有 指 

向 要 在 操作 中 所 使 用 的 数据 ， 而 是 指向 了 存储 器 中 或 某 个 寄存 器 中 的 相关 数据 ( 即 

实际 数据 地 址 ) 的 地 址 ， 并 且 该 地 址 必须 首先 被 访问 才 可 以 获得 所 需 的 实际 数据 

地 址 。 

关于 指令 地 址 (instruction address) 操作 数 ， 最 常见 的 两 种 寻 址 方式 说 明 如 下 : 

程序 计数 器 相对 寻 址 (PC-relative addressing): 有 关 指 令 的 存储 器 地 址 可 以 通过 把 程 

序 计数 器 ( Program Counter，PC) 寄存 器 的 内 容 与 一 个 偏 移 量 相 加 来 计算 获得 。 通 

常情 况 下 ， 程序 计数 器 寄存 器 保存 着 要 执行 的 下 一 条 指令 的 地 址 。 于 是 ， 与 基 址 寄 

存 器 寻 址 方式 一 样 ， 相 关 偏 移 量 可 以 是 包含 在 指令 本 身 中 的 直接 的 数值 ， 也 可 以 是 

某 个 索引 寄存 器 中 的 数值 。 

间接 寻 址 ( indirect addressing) : 有 关 指 令 的 存储 器 地 址 存放 在 一 个 寄存 器 或 另 一 个 

存储 器 单元 中 。 与 数据 操作 数 的 间接 寻 址 方式 一 样 ， 有 关 指 令 并 没有 指向 要 转移 的 

地 址 ， 而 是 指向 了 存储 器 中 或 寄存 器 中 的 相关 数据 〈 即 实际 转移 地 址 ) 的 地 址 ， 并 且 

必须 首先 访问 该 地 址 才 可 以 获得 所 需 的 实际 转移 地 址 。 

部 分 上 述 寻 址 方式 如 图 A-2 所 示 。 

一 般 情况 下 ， 操 作 类 型 将 会 决定 如 何 来 解析 操作 数 一 一 无 论 是 作为 存储 器 地 址 ， 还 是 作 
为 指令 地 址 ， 亦 或 作为 直接 数据 值 ， 也 可 能 是 以 某 种 其 他 的 方式 。 通 常情 况 下 ， 精 简 指 令 集 
计算 机 处 理 器 拥有 的 寻 址 方式 较为 有 限 ， 而 复杂 指令 集 计 算 机 处 理 器 则 往往 拥有 种 类 繁多 的 
寻 址 方式 。 
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在 这 里 ,我 们 举例 说 明 一 些 简单 的 指令 格式 以 及 相应 的 寻 址 方式 ， 如 图 A-2 所 示 。 

图 A-2a 具体 说 明了 一 种 加 法 (add) 运算 指令 ， 也 就 是 说 ， 把 寄存 器 A 和 寄存 器 B 的 内 
容 相 加 ， 并 把 结果 存放 到 寄存 器 C 中 。 其 间 ， 要 加 的 数值 必须 事先 通过 先前 的 指令 分 别 加 
载 到 寄存 器 A 和 寄存 器 B 中 。 

图 A-2b 具体 说 明了 另 一 种 加 法 运算 指令 ， 其 中 的 一 个 操作 数 是 存放 在 指令 本 身 中 的 立 
即 数据 值 。 该 运算 指令 将 寄存 器 A 的 内 容 和 立即 操作 数 的 数值 相 加 ， 并 将 结果 存放 到 寄存 
器 C 中 。 

图 A-2c 具体 说 明了 一 种 加 载 (load) 操作 指令 ， 用 于 把 存储 器 单元 中 的 数据 值 放 入 寄存 
器 A 中 。 该 指令 采用 了 基 址 寄存 器 寻 址 方式 来 计算 相应 的 存储 器 单元 地 址 。 具 体 而 言 ， 把 
基 址 寄存 器 中 的 内 容 和 索引 寄存 器 中 的 内 容 相 加 ， 对 应 的 和 值 结 果 被 用 作 存 储 器 单元 的 地 
址 ， 且 对 应 的 存储 器 单元 的 内 容 被 传送 和 加 载 到 结果 寄存 器 A 中 。 

图 A-2d 具体 说 明了 一 种 无 条 件 跳 转 (jump) 操作 指令 ， 用 来 将 控制 转移 到 下 一 条 指令 
之 外 的 其 他 某 条 指令 处 。 其 根据 基 址 寄存 器 的 内 容 和 立即 数据 值 来 计算 下 一 条 要 执行 的 指令 
的 存储 器 单元 地 址 。 进 一 步 说 ， 通 过 将 基 址 寄存 器 的 内 容 与 存放 在 指令 本 身 中 的 立即 操作 数 
(作为 索引 或 偏 移 量 ) 相 加 ， 就 可 以 得 到 下 一 条 即将 执行 的 指令 的 存储 器 单元 地 址 。 

图 A-2e 具体 说 明了 一 种 相等 条 件 下 的 分 支 跳 转 (conditional branch-on-equal) 操作 指 
令 。 该 指令 首先 比较 寄存 器 A 和 寄存 器 B 的 取 值 。 如 果 二 者 的 取 值 相等 ， 那 么 就 将 控制 转 
移 到 这 样 的 一 条 指令 上 ， 即 所 转 去 执行 的 指令 的 存储 器 单元 地 址 是 根据 程序 计数 器 寄存 器 的 
内 容 (下 一 条 指令 的 地 址 ) 与 当前 指令 中 的 立即 数据 值 相 加 所 得 到 的 。 这 样 的 指令 通常 可 以 
用 于 循环 控制 。 


寄存 器 A | 所 输入 的 数据 值 。 


寄存 器 C 所 输出 结果 的 数据 值 ( 所 输入 的 数据 值 的 和 值 ) 


寄存 器 。 寄存 器 。 寄存 器 
地 址 地 址 地 址 


者 集 存 名 


a) 加 法 运算 指令 及 寄存 器 寻 址 方式 


让 各 
寄存 器 C | “所 和 输出 结果 的 数据 值 《所 输入 的 数据 值 的 和 值 ) 


寄存 器 。 寄存 器 所 输入 的 
数据 值 


指令 告 存 名 
b) 加 法 运算 指令 及 寄存 器 寻 址 方式 和 立即 寻 址 方式 
图 A-2 寻 址 方式 和 指令 格式 
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惟有 
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存储 器 单元 欲 加 载 装 人 寄存 器 A 的 数据 值 到 
基 址 寄存 器 | 所 输入 的 用 作 人 参照 的 存储 器 地 址 










索引 寄存 器 所 输入 的 偏 移 量 数值 


寄存 器 A 所 输出 结果 的 数据 值 ( 从 存储 器 单元 加 载 来 ) 


寄存 器 。 寄存 器 寄存 器 
地 址 地 址 地 址 


c) 加 载 操作 指令 及 寄存 器 寻 址 方式 (涉及 基 址 寄存 器 和 索引 寄存 器 ) 


存储 器 单元 下 一 条 要 执行 的 指令 
基 址 寄存 器 所 输入 的 用 作 参 照 的 存储 器 地 址 





指令 寄存 器 | 操作 码 | 。 基 址 寄存 器 。 | 立即 操作 数 的 数值 


d) 跳 转 操作 指令 及 立即 数 相 对 地 址 





程序 计数 器 





指令 寄存 器 | 操作 码 | 寄存 器 A | 寄存 器 B | ”立即 操作 数 的 数值 


e) 条 件 分 支 操作 指令 及 基于 程序 计数 器 的 索引 寻 址 方式 
图 A-2 ( 续 ) 
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除了 确定 不 同 的 寻 址 方式 一 一 确定 如 何 解 释 操 作 数 的 位 置 和 取 值 一 一 之 外 ,许多 处 理 器 
还 具有 两 种 执行 模式 (execution mode)。 当 用 户 或 应 用 程序 执行 的 时 候 ， 一 般 使 用 的 是 用 户 
模式 ( user mode)。 而 当 操作 系统 内 核 例 程 执行 的 时 候 ， 则 往往 使 用 监管 模式 ( supervisory 
mode， 或 称 为 管 态 ) 或 特权 模式 (privileged mode)。 处 理 器 中 的 某 个 特殊 寄存 器 用 来 确定 
系统 当前 正在 使 用 哪 种 执行 模式 。 当 处 于 用 户 模式 时 ， 将 会 在 指令 执行 期 间 启动 实施 某 些 保 
护 机 制 。 例 如 ， 在 用 户 模式 下 将 启用 内 存 保护 机 制 ， 以 禁止 用 户 程序 去 访问 有 关 分 配给 该 程 
序 的 内 存 部 分 之 外 的 存储 器 单元 。 同 时 ， 某 些 特权 指令 ( 壁 如 控制 输入 /输出 设备 的 指令 ) 
只 有 在 系统 处 于 监管 模式 的 情况 下 才 人 允许 执 行 。 


A.2.2 处理 器 组 成 部 件 


图 A-3 是 关于 处 理 器 典型 部 件 及 组 成 结构 的 一 个 简 图 。 其 中 ， 整 数 算术 逻辑 部 件 〈 Arith- 
metic and Logic Unit，ALU) 和 浮 点 部 件 ( floating point unit) 包括 执行 指令 集运 算 操 作 的 硬 
件 电 路 。 大 多 数 常规 指令 均 由 整数 算术 逻辑 部 件 加 以 处 理 ， 而 浮 点 算术 指令 则 由 浮 点 部 件 负 
责 处 理 ， 因 为 相关 运算 操作 需要 更 复杂 且 高 度 专用 的 电路 。 控 制 器 ( control unit) 通常 包括 
处 理 器 寄存 器 以 及 各 种 控制 电路 ， 例 如 用 于 控制 指令 执行 顺序 的 电路 、 用 来 解析 有 关 指 令 代 
码 和 操作 数 的 控制 电路 以 及 用 来 控制 有 关 算 术 逻 辑 部 件 或 浮 点 部 件 电路 的 指令 的 执行 的 电路 。 





图 A-3 处理 器 典型 部 件 及 结构 简 图 


图 A-3 中 所 示 的 处 理 器 高 速 缓存 ( processor cache) 是 作为 处 理 器 芯片 组 成 部 分 的 存储 
器 部 件 ， 并 且 保 存 有 当前 处 理 器 正在 使 用 的 来 自主 内 存 (main memory， 简 称 主 存 或 内 存 ) 
的 指令 和 数据 。( 另 外 ,在 处 理 器 世 片 自身 外 部 也 可 能 存在 其 他 的 高 速 缓存 存储 器 。) 处 理 器 
高 速 缓存 经 由 单独 的 存储 器 总 线 ( memory bus， 或 称 为 内 存 总 线 ) 连接 到 了 主 存 上 。 同 时 ， 
主 存 也 与 主 系统 总 线 (system bus) 相连 接 。 而 控制 器 则 通过 系统 总 线 连接 到 了 输入 /输出 设 
备 上 。 内 存 直 接 存 取 (Direct Memory Access，DMA ) 型 控制 器 是 另外 的 一 个 部 件 ， 支 持 将 
数据 直接 从 输入 /输出 设备 传送 到 内 存 。 我 们 将 在 第 A.3.2 节 中 详细 讨论 缓存 机 制 及 相关 概 
念 ， 而 内 存 直 接 存 取 型 控制 器 已 在 第 14 章 进行 过 讨论 ， 这 里 不 再 闭 述 。 


A.2.3” 源 程序 、 目 标 程序 和 可 执行 程序 


汇编 语言 (assembly language) 是 机 器 语言 指令 的 替代 形式 ， 更 方便 也 更 容易 被 人 阅读 
(和 编写 ) 。 在 汇编 语言 中 ， 每 个 可 能 的 操作 码 被 赋予 了 一 个 助 记 符 (mnemonic name)， 即 
一 个 用 来 识别 相应 指令 的 符号 名 称 。 操 作 数 可 以 呈现 为 数字 形式 ， 或 者 也 可 以 是 用 来 标识 
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映射 到 内 存 地 址 或 寄存 器 的 程序 变量 的 名 称 。 采 用 诸如 C++ 等 高 级 程序 设计 语言 编写 的 程 
序 称 为 源 代码 ( source code) 或 源 程序 ( source program ) 可 以 由 对 应 的 程序 设计 
语言 编译 器 ( compiler) 转换 为 机 器 语言 的 程序 ， 称 为 目标 代码 ( object code) 或 目标 程序 
( object code program 或 object program ) 。 在 此 基础 上 ， 此 类 目标 代码 程序 与 其 所 需 的 来 自 
程序 库 和 其 他 程序 模块 中 的 目标 代码 程序 相 链接 ， 就 可 以 创建 可 执行 代码 程序 ( executable 
code program， 或 executable program， 即 可 执行 程序 ) 文件 。 其 通常 作为 二 进 制 文件 存储 在 
磁盘 上 ， 故 而 有 时 被 称 为 程序 二 进 制 (program binary，bin) 文件 。 当 需要 时 ， 可 执行 代码 
将 被 加 载 到 内 存 中 ， 然 后 ， 有 关 程 序 指令 就 会 在 处 理 器 上 按照 期 望 的 顺序 加 以 执行 。 

良好 的 程序 设计 语言 编译 器 应 当 在 创建 目标 代码 时 充分 利用 对 应 机 器 指令 集中 的 各 种 指 
令 。 因 此 ， 开 发 编译 器 的 程序 设计 人 员 必 须 认 真 仔细 地 研究 每 台 机 器 的 指令 集体 系 结构 ， 以 
便于 充分 利用 相应 的 功能 。 


A.2.4 ”处理 器 寄存 器 、 数 据 通路 及 控制 


在 处 理 器 的 组 成 部 分 中 有 几 种 类 型 的 寄存 器 ， 它 们 由 处 理 器 电路 采用 各 种 方式 来 加 以 使 
用 。 一 些 处 理 器 使 用 了 通用 寄存 器 (general-purpose register)， 其 中 相同 的 物理 寄存 器 可 以 
按照 下 面 所 讨论 的 多 种 方式 甚至 所 有 方式 进行 使 用 。 而 在 其 他 处 理 器 的 设计 中 ， 则 把 一 些 寄 
存 器 或 者 所 有 寄存 器 作为 专用 寄存 器 ( special-purpose register)， 并 且 只 能 用 于 特定 的 功能 。 
如 下 是 最 常见 的 几 类 寄存 器 及 其 用 法 : 

e 指令 寄存 器 ( instruction register) : 用 来 保存 正在 执行 的 指令 。 它 们 直接 连接 到 有 关 

在 执行 指令 时 用 来 解析 操作 码 和 操作 数 的 控制 电路 上 。 

e。 程序 计数 器 (Program Counter，PC): 也 被 称 为 指令 计数 器 (instruction counter)， 用 
来 保存 要 执行 的 下 一 条 指令 的 地 址 。 当 有 关 程 序 被 加 载 到 内 存 并 被 启动 执行 时 ， 程 
序 计数 器 被 初始 化 为 第 一 条 程序 指令 的 地 址 。 而 在 执行 指令 的 时 候 ， 当 前 指令 的 长 
度 通 常会 被 加 到 程序 计数 器 上 ， 以 便于 提取 下 一 条 顺序 指令 。 当 然 ， 分 支 或 子 程序 
调用 或 其 他 控制 转移 操作 可 以 改变 程序 执行 次 序 、 程 序 计数 器 取 值 以 及 更 新 方式 。 

e 数据 寄存 器 ( data register) : 用 来 保存 操作 数 。 有 些 数据 寄存 器 可 专用 于 保存 特定 的 

数据 类 型 的 操作 数 ， 例 如 ， 浮 点 寄存 器 (floatingpoint register) 只 能 用 来 保存 浮 点 操 
作 数 。 小 型 处 理 器 往往 可 能 只 有 一 个 主 数据 寄存 器 ( main data register)， 通 常 称 之 为 
累加 器 (accumulator)。 在 某 些 情 况 下 ， 还 会 有 一 个 用 来 保存 较 大 操作 数 或 除法 运算 余 
数 的 附加 寄存 器 ， 而 且 一 般 称 之 为 累加 器 扩展 寄存 器 (accumulator extension register ) 。 

e 地 址 寄存 器 (address register): 用 来 保存 存储 操作 数 或 指令 的 主 存 地 址 的 值 。 它 们 可 
以 保存 绝对 存储 器 地 址 ( absolute memory address， 或 简 记 作 absolute address， 即 绝 
对 地 址 ) 或 者 相对 存储 器 地 址 ( relative memory address， 或 简 记 作 relative address， 
即 相 对 地 址 )， 后 者 也 就 是 偏 移 地 址 (offset， 或 称 为 偏 移 量 )， 且 偏 移 地 址 与 基 址 寄 
存 器 ( base register) 的 内 容 相 加 就 可 以 计算 获得 绝对 地 址 。 保 存 相 对 地 址 的 寄存 器 
被 称 为 索引 寄存 器 (index register) 。 

中 断 寄存 器 ( interrupt register) : 用 来 保存 有 关 可 能 发 生 的 中 断 事件 的 信息 ， 我 们 将 
在 稍 后 加 以 讨论 。 

程序 状态 寄存 器 (program status register): 用 来 保存 处 理 器 所 需 的 控制 信息 。 不 同 的 
机 器 可 能 具有 任意 数量 的 状态 寄存 器 ， 并 且 内 容 相差 很 大 。 举 例 说 明 它 们 所 保存 的 
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各 类 控制 信息 如 下 : 

里 最 后 一 次 比较 操作 的 结果 ( 即 a>b、a=b 或 a<b) 

四 处 理 吕 状态 ( 即 处 理 器 是 处 于 用 户 模式 还 是 监管 模式 ) 

甸 错误 状态 ， 例 如 算术 溢出 、 除 零 错误 等 

时 钟 (clock): 时 钟 寄存 器 (clock register) 实际 上 是 一 种 倒计时 到 零 并 产生 中 断 一 一 
称 之 为 时 钟 中 断 (clock interrupt) 或 定时 器 中 断 (timer interrupt) 一 一 的 定时 带 
(timer)。 鉴 于 各 种 原因 ， 时 钟 中 断 可 以 由 操作 系统 来 进行 设置 。 例如， 在 多 用 户 系 
统 中 ， 有 关 操 作 系 统 通常 在 被 称 为 时 间 片 ( time quantum， 或 称 为 时 间 量 ) 的 有 限时 
间 期 限 内 把 处 理 器 控制 权 交 给 用 户 程序 。 而 通过 设置 定时 器 中 断 ， 如 果 有 关 用 户 程 
序 在 时 间 片 结束 时 还 在 运行 ， 那么 操作 系统 就 可 以 中 断 该 用 户 程 序 ， 并 检查 其 他 程 
序 是 否 正在 等 待 要 运行 在 相应 的 处 理 器 上 。 时 钟 中 断 也 可 用 来 计算 实际 的 日 期 和 时 
间 。 需 要 强调 的 是 ， 处 理 器 常常 具有 一 条 特权 指令 且 只 能 由 操作 系统 执行 ， 用 来 将 
一 个 时 间 量 数值 加 载 到 时 钟 寄 存 器 中 进行 时 间 的 设 定 ， 所 以 用 户 程序 不 能 绕 过 操作 
系统 直接 推翻 或 撤销 操作 系统 所 设 定 的 时 钟 值 。 

当然 ， 有 些 寄存 器 可 以 由 用 户 程序 直接 设置 ， 故 而 被 称 为 用 户 可 见 寄存 器 (user-visible 
register)。 它 们 通常 包括 数据 寄存 器 、 地 址 寄存 器 和 指令 寄存 器 。 但 其 他 的 寄存 器 往往 只 能 
由 处 理 器 或 操作 系统 内 核 进行 设置 ， 例 如 状态 寄存 器 和 中 断 寄 存 器 。 精 简 指 令 集 计算 机 处 理 
器 通常 拥有 大 量 的 通用 寄存 器 ， 因 为 它们 具有 统一 的 指令 集 设计 。 相 比 之 下 ， 复 杂 指 令 集 计 
算 机 处 理 器 则 常常 同时 兼 有 通用 寄存 器 和 专用 寄存 器 。 某 些 类 型 的 寄存 器 使 用 可 能 要 求 专用 
寄存 器 ， 例 如 中 断 寄存 器 、 程 序 状 态 寄 存 器 和 指令 寄存 器 。 

(根据 操作 码 来 ) 识别 特定 指令 的 电路 以 及 利用 操作 数 执行 指令 的 电路 与 指令 寄存 器 相 
连接 。 由 于 指令 执行 牵涉 通过 有 关 硬 件 电路 从 寄存 器 和 内 存 来 传送 信息 (操作 码 、 操 作 数 
等 )， 故 而 这 些 电 路 有 时 被 称 为 处 理 器 的 数据 通路 ( data path) 部 件 。 另 一 方面 ， 用 来 控制 下 
一 条 指令 的 提取 的 电路 以 及 用 来 控制 诸如 中 断 〈 详 见 后 面 描述 ) 等 其 他 事件 的 处 理 的 电路 被 
称 为 处 理 器 的 控制 部 件 。 


A.2.5 系统 时 序 


系统 时 钟 (system clock) 是 各 种 处 理 器 内 部 另外 的 一 种 用 来 实施 系统 时 序 ( system tim- 
ing) 的 重要 部 件 。 大 多 数 逻 辑 电路 的 操作 都 是 以 同步 节拍 方式 向 前 推进 的 。 在 电子 级 别 ， 这 
被 称 为 系统 时 钟 。( 这 不 应 与 操作 系统 用 于 定时 的 处 理 器 寄存 器 混为一谈 。) 系统 时 钟 周期 
(clock cycle) 是 指 期 间 可 能 发 生 处 理 器 操作 的 固定 的 最 短 的 时 间 间 隔 。 处 理 器 的 速度 取决 于 
系统 时 钟 每 秒 产生 的 周期 数 。 一 个 10 亿 替 效 的 处 理 器 每 秒 将 会 拥有 10 亿 个 时 钟 周 期 。 处 理 
器 技术 和 指令 集 设 计 是 决定 处 理 器 总 体 速 度 的 主要 因素 ， 且 简单 指令 的 执行 完成 比 复杂 指令 
将 花费 更 少 的 时 钟 周 期 数 。 于 是 ， 这 被 认为 是 精简 指令 集 计 算 机 机 器 的 一 项 优点 ， 因 为 精简 
指令 集 计 算 机 的 指令 通常 比 复杂 指令 集 计 算 机 的 指令 以 更 少 的 时 钟 周期 数 来 执行 完成 。 


A.2.6 ”指令 执行 周期 和 流水 线 


通常 情况 下 ， 典 型 的 指令 执行 周期 一 般 可 划分 为 以 下 5 个 阶段 : 
e 指令 提取 (instruction fetch): 把 有 关 指 令 从 存储 器 中 取出 ， 并 放 到 指令 寄存 器 中 。 
e 解码 (decode): 分 析 和 译 解 操作 码 ， 并 确定 有 关 输入 操作 数 的 位 置 。 
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e 数据 提取 (data fetch): 如 果 需 要 ， 就 从 存储 器 中 提取 相应 的 操作 数 。 

e 执行 (execute): 执行 对 应 的 操作 。 

e 写 回 结果 (write-back): 把 操作 输出 结果 存放 到 适当 的 位 置 。 

注意 ， 有 关 指 令 或 操作 数 可 能 是 在 高 速 缓存 存储 器 ( cache memory， 或 称 为 高 速 缓存 ) 
中 而 不 是 在 主 内 存 (primary memory， 简 称 为 主 存 或 内 存 ) 中 。 对 于 许多 简单 指令 来 说 ， 每 
个 阶段 通常 需要 一 个 时 钟 周期 ， 尽 管 这 可 能 会 根据 处 理 器 、 指 令 类 型 以 及 操作 数 寻 址 方式 而 
有 所 不 同 。 因 此 , 一 条 简单 的 指令 从 开始 到 完成 将 需要 5 个 时 钟 周 期 。 为 了 提高 程序 执行 的 
速度 ， 大 多 数 现代 的 处 理 器 都 采用 了 一 种 称 为 流水 线 (pipelining) 的 策略 ， 即 允许 前 后 连续 
指令 的 执行 阶段 相互 重奏 。 例 如 ， 当 一 条 指令 处 于 该 指令 的 写 回 结果 阶段 时 ， 下 一 条 指令 将 
处 于 对 应 指令 的 执行 阶段 ， 而 再 下 一 条 指令 将 处 于 相应 指令 的 数据 提取 阶段 ， 以 此 类 推 。 只 
要 所 有 指令 均 按 照 顺序 次 序 加 以 执行 ， 故 而 处 理 器 就 可 以 预先 知道 它们 的 执行 次 序 ， 那 么 这 
种 策略 就 能 够 发 挥 效用 。 在 这 种 情况 下 ， 将 可 能 实现 指令 处 理 的 5 倍 提 速 。 

流水 线 处 理 器 (pipelining processor) 必须 包括 针对 诸如 分 支 和 跳 转 指令 等 改变 执行 次 
序 的 指令 的 应 对 处 理 措施 。 进 一 步 说 ， 一 次 跳 转 操作 将 会 终止 一 个 执行 流水 线 ( execution 
pipeline)， 并 会 在 另 一 不 同 的 指令 位 置 开 启 另 一 个 执行 流水 线 。 而 如 果 在 有 关 指 令 的 执行 周 
期 开始 之 后 确定 了 分 支 转 移 操 作 ， 那 么 已 经 历 了 它们 的 执行 周期 的 某 些 步骤 的 指令 有 可 能 
不 得 不 被 取消 (撤销)。 还 有 ， 如 果 一 条 指令 需要 由 其 前 一 条 指令 产生 的 操作 数 作为 其 输入 ， 
那么 有 时 候 就 需要 延迟 相应 的 流水 线 。 因 此 ， 通 过 流水 线 实际 达到 的 提速 效果 必须 通过 根据 
许多 不 同 程序 可 以 获得 的 提速 结果 的 平均 值 来 进行 估算 。 


A.2.7 ”中断 


中 断 〈interrupt) 是 处 理 器 所 包含 的 一 项 重要 功能 。 中 断 与 操作 系统 密切 相关 ， 正 如 我 
们 在 本 书 中 所 看 到 的 ， 操 作 系 统 采取 各 种 各 样 的 方式 对 中 断 进行 了 利用 。 通 常情 况 下 ， 中 断 
是 一 种 异步 事件 (asynichronous event)， 即 可 能 在 任何 时 间 发 生 的 事件 ， 故 而 与 系统 时 钟 和 
处 理 器 指令 执行 周期 并 不 同步 。 中 断 将 向 处 理 器 发 出 信号 ， 告 知 其 需要 处 理 高 优先 级 事件 。 
处 理 器 硬件 往往 包含 了 可 由 中 断 事件 (interrupting event) 进行 设置 的 一 个 或 多 个 中 断 寄存 器 
(interrupt register ) 。 

每 当 指令 执行 完成 的 时 候 ， 有 关 控 制 电路 就 会 自动 检查 是 否 有 中 断 事 件 对 中 断 寄存 器 的 
内 容 进 行 了 某 种 设置 。 因 此 ， 只 有 在 指令 切换 的 时 候 ， 而 不 能 在 指令 执行 的 过 程 中 来 为 中 断 
提供 服务 ， 即 处 理 中 断 事 件 9?。 如 果 检 查 确认 发 生 了 中 断 事件 ， 那 么 处 理 器 状态 ( processor 
state 应 当 被 
保存 到 存储 器 中 ， 并 且 跳 转 到 处 理 中 断 的 程序 代码 处 继续 执行 。 一 且 完 成 了 有 关中 断 处 理 程 
序 (interrupt handler)， 那 么 系统 通常 将 恢复 处 理 器 状态 ， 并 从 当初 中 断 的 位 置 起 恢复 相应 的 
用 户 程序 的 执行 。 而 如 果 中 断 导 致 当前 程序 被 终止 或 者 暂停 ， 那 么 操作 系统 就 可 以 切换 到 另 
一 程序 加 以 运行 。 

在 处 理 中 断 的 同时 ， 往 往 会 禁用 那些 低 优先 级 或 者 不 太 重 要 的 中 断 ， 直 到 当前 中 断 处 
理 完成 ， 具体 由 操作 系统 通过 设置 中 断 禁 用 (interrupt disable) 寄存 器 或 中 断 屏蔽 (interrupt 
mask) 寄存 器 来 予以 实现 。 根 据 该 寄存 器 中 的 取 值 ， 系 统 就 不 会 去 检查 较 低 优先 中 断 级 别 上 





”在 采用 流水 线 技术 的 情况 下 ,每 当 一 条 指令 完成 其 执行 周期 的 时 候 ， 就 会 检查 中 断 。 故 而 处 理 器 应 当 提 
供 相应 机 制 来 善后 处 理 中 断 处 理 时 那些 部 分 执行 尚未 完成 就 被 取消 的 后 续 指令 。 
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的 中 断 。 因 此 ， 操 作 系 统 便 可 以 在 开始 中 断 处 理 之 前 先 对 该 寄存 器 进行 设置 ， 并 在 完成 中 断 
处 理 之 后 再 对 其 进行 复位 。 

我 们 可 以 把 引发 中 断 的 事件 划分 成 硬件 事件 (hardware event) 和 软件 事件 (software 
event)。 一 般 来 说 ， 硬 件 中 断 (hardware interrupt) 是 异步 的 ， 而 软件 中 断 (software interrupt) 
是 同步 的 。 可 触发 中 断 的 各 类 典型 硬件 事件 说 明 如 下 : 

。 发 生 了 用 户 的 一 些 输 入 /输出 操作 ， 例 如 鼠标 移动 或 鼠标 按钮 点 击 或 键盘 输入 。 在 
这 种 情况 下 ， 相 应 中 断 处 理 程序 将 检索 和 取 回 有 关 输 入 / 输出 操作 的 信息 ， 壁 如 鼠标 
坐标 或 从 键盘 输入 的 字符 。 
完成 了 磁盘 输入 /输出 传输 操作 。 在 这 种 情况 下 ， 相 应 中 断 处 理 程序 应 检查 是 否 存 
在 被 挂 起 的 其 他 的 磁盘 输入 /输出 操作 ， 如 果 存 在 ， 则 启动 下 一 项 磁盘 输入 /输出 传 
输 操 作 ， 把 对 应 数据 从 磁盘 传输 到 主 存 中 或 者 从 主 存 传 输 到 磁盘 上 。 

发 生 了 时 钟 定时 器 中 断 。 在 这 种 情况 下 ， 应 允许 操作 系统 将 处 理 器 分 配给 另 一 道 程序 。 

可 以 引起 中 断 的 软件 事件 可 以 进一步 细 分 为 异常 (trap， 或 称 为 陷入 事件 ) 和 系统 调用 
(system call) 。 前 者 是 指 当 程序 发 生 错 误 或 违规 操作 时 发 生 的 软件 事件 ， 而 后 者 则 指 当 用 户 
程序 向 操作 系统 请 求 提供 服务 时 所 发 生 的 软件 事件 。( 由 于 历史 原因 ， 系 统 调用 中 断 有 时 也 





被 称 为 陷 人 一 一 这 其 实 有 点 混 消 。) 导致 异常 发 生 的 一 些 事件 说 明 如 下 : 
e 违反 存储 保护 的 操作 事件 ， 例 如 ， 一 道 以 用 户 模式 执行 的 程序 试图 访问 在 其 允许 的 
存储 器 空间 之 外 的 存储 器 区 域 。 
。 违反 指令 保护 的 操作 事件 ， 例 如 ， 一 道 以 用 户 模式 执行 的 程序 试图 执行 某 条 保留 为 
监管 程序 模式 才 可 执行 的 指令 。 


。 诸如 除 以 零 之 类 的 指令 错误 。 

。 诸如 浮 点 数 溢出 之 类 的 算术 错误 。 

我 们 通过 这 本 书 详细 地 讨论 了 有 关 操 作 系 统 是 如 何 处 理 以 上 这 些 事 件 以 及 其 他 引发 中 断 
的 事件 的 。 


A.2.8” 微 程序 设计 


在 一 些 计 算 机 中 ， 通 常 采用 微 程 序 设计 ( microprogramming) 的 概念 ， 而 将 复杂 指令 实 
现 为 基本 指令 的 序列 。 换 句 话 说 ， 微 程序 ( microprogram) 是 指 实现 较 复杂 操作 的 基本 操作 
的 序列 。 相 关 序 列 存 放 在 处 理 器 中 的 特定 的 微 程序 存储 器 中 ， 以 便 在 执行 复杂 指令 时 能 够 加 
以 调用 。 微 程序 有 时 也 被 称 为 固件 ( firmware)。 有 些 处 理 器 体系 结构 (通常 是 复杂 指令 集 计 
算 机 ) 采用 了 微 程 序 设 计 技 术 ， 但 其 他 的 处 理 器 体系 结构 则 未 予 使 用 。 


A.2.9 处 理 器 芯片 


历史 上 ， 处 理 器 是 由 诸如 继电器 、 电 子 管 、 唱 体 管 或 简单 集成 电路 等 分 立 元 件 而 构建 的 。 
在 现代 系统 中 ， 整 个 处 理 器 通常 被 实现 为 单一 的 集成 电路 (芯片 )。 处 理 器 芯片 (processor 
chip) 通常 包含 有 处 理 器 、 时 钟 、 寄 存 器 、 高 速 缓存 存储 器 以 及 取决 于 特定 处 理 器 设计 的 其 
他 可 能 的 电路 。 


A.2.10 多核 芯片 
在 过 去 的 几 年 中 ， 处 理 器 集成 电路 的 制造 商 已 经 得 出 了 这 样 的 一 个 结论 ， 即 对 更 快 的 处 


= 


理 器 的 需求 将 会 有 所 减缓 。 为 此 ， 他 们 已 经 开始 着 手 尽 量 利用 芯片 上 的 额外 空间 来 封装 多 个 
处 理 器 ， 即 多 核 芯 片 (multicore chip)。 同 时 ， 关 于 高 速 缓存 存储 器 的 放置 ， 也 存在 各 种 各 
样 的 选择 设计 方案 。 我 们 将 会 在 下 一 节 中 就 有 关 高 速 缓存 机 制 展开 讨 论 。 尽 管 这 看 起 来 是 一 
个 相当 微不足道 的 改变 ， 但 是 我 们 在 内 存 的 相关 章节 中 能 够 看 出 ， 高 速 缓存 机 制 对 于 操作 系 
统 却 是 比较 重要 的 。 目 前 ， 具 有 4 个 处 理 器 核 (GPU core) 的 芯片 已 十 分 常见 。 预 测 在 未 来 
的 几 年 内 ,将 会 朝 着 最 多 128 个 处 理 器 核 的 方向 继续 迈进 5 

诚然 ， 要 编写 能 够 同时 有 效 地 使 用 多 个 处 理 器 的 程序 确实 非常 困难 。 然 而 ， 大 多 数 的 
用 户 都 有 许多 程序 在 同时 运行 ， 所 以 让 多 个 处 理 右 来 运行 这 些 程序 必然 意味 着 它们 都 将 运行 
得 更 为 快捷 。 而 且 ， 大 多 数 的 用 户 经 带 使 用 的 也 就 那么 几 个 程序 ， 并 且 它 们 均 已 经 过 精心 设 
计 开 发 和 做 好 了 使 用 多 个 处 理 器 的 准备 ,这 些 程序 包括 我 们 使 用 最 多 的 那些 程序 中 的 大 部 
分 一 一 字 处 理 程 序 、 电 子 表格 、 浏 览 器 等 。 


A.3。 存储 器 部 件 和 计算 机 存储 体系 
A.3.1 存储 单位 : 位 、 字 节 和 字 


存储 器 部 件 (memory unit) 是 存储 处 理 器 所 需 的 有 关 程 序 指令 和 操作 数 的 硬件 。 基 
本 的 物理 存储 单位 是 单个 的 二 进 制 位 ,或 简称 位 ( bit， 或 称 为 比特 )， 其 存储 了 一 个 二 
进 制 的 零 ( 0) 值 或 一 (1) 值 。 在 现代 系统 中 ,位 经 常 ( 按 每 8 位 一 组 而 ) 被 编组 为 字 
节 (byte)， 并 且 字 节 又 常常 被 编组 成 字 ( word)。 通 常情 况 下 ， 每 个 字 为 4 字 节 或 8 字 
节 ， 但 是 为 艇 入 式 系统 所 设计 的 处 理 器 也 可 能 具有 1 字 节 或 2 字 节 的 字 。 正 常情 况 下 ， 
在 存储 器 部 件 和 处 理 器 之 间 传 送 的 基本 单位 是 字 。 而 一 般 来 讲 ， 往 往 设 立 有 人 允许 加 载 或 
存储 单个 字 节 或 半 字 (half word) 的 指令 。 在 大 多 数 的 系统 中 ， 每 个 字 节 均 具 有 唯一 的 
存储 器 地 址 ( memory address， 有 时 也 称 为 内 存 地 址 )。 给 定 一 个 特定 的 存储 器 地 址 ， 有 
关 存 储 器 电路 就 能 够 将 该 特定 字 节 和 定位 在 存储 器 中 的 特定 位 置 上 ， 进 而 就 可 以 将 包含 该 
字 节 的 字 传 送 到 处 理 器 或 者 从 处 理 器 传送 到 存储 器 中 的 特定 位 置 上 。 存 储 器 字 节 或 字 也 
可 以 传输 到 输入 /输出 设备 ,或 者 从 输入 /输出 设备 传输 到 存储 器 中 。 在 许多 情况 下 ， 
存储 器 和 输入 /输出 设备 之 间 直 接 传送 的 往往 是 由 多 个 字 所 组 成 的 数据 块 ， 或 简称 为 块 
(block )。 

字 大 小 (word size) 通常 是 处 理 器 寄存 器 的 标准 大 小 。 为 此 ，32 位 处 理 器 应 当 具 有 32 
位 ， 即 4 字 节 的 标准 数据 项 。 另 一 方面 ，16 位 处 理 器 通常 具有 与 许多 旧式 的 个 人 计算 机 处 
理 器 一 样 的 16 位 数据 格式 。 某 些 处 理 器 则 具有 64 位 ， 即 “ 双 字 ” ( double word) 的 数据 大 
小 。 曾 几何 时 ， 这 种 字 大 小 主要 是 出 现在 大 型 计算 机 上 的 。 但 是 现在 ， 大 多 数 的 处 理 器 都 是 
32 位 的 ， 而 且 ， 今 天 的 个 人 计算 机 正在 向 64 位 格式 演化 。 尽 管 一 些 操作 数 也 可 以 是 单字 节 
或 2 字 节 或 8 字 节 ， 然 而 ， 许 多 操作 数 的 大 小 经 常 是 一 个 字 的 大 小 (4 字 节 )。 特 定 的 操作 
码 将 确定 每 个 操作 数 的 类 型 和 大 小 。 

随 着 基本 数据 字 大 小 (basic data word size) 从 16 位 扩展 到 64 位， 指令 格式 的 大 小 也 
在 变 长 ， 主 要 是 希望 能 够 使 用 更 大 的 存储 器 地 址 。 复 杂 指 令 集 计算 机 机 器 中 的 指令 往往 是 可 
变 长 度 的 ， 因 为 其 仅仅 需要 几 位 来 指定 寄存 器 ， 而 许多 位 则 被 用 来 指定 存储 器 地 址 。 根 据 寻 
址 方式 ， 相 关 指 令 往往 可 以 指定 从 0 个 到 3 个 存储 器 地 址 ， 故 而 对 应 指令 长 度 也 将 相应 地 、 
变化 。 


府 录 ”人 计 滤 机 系统 总 览 和 体系 谨 欧 杉 仿 。 415 


A.3.2 存储 体系 


当前 的 大 多 数 系统 都 具有 多 个 级 别 的 存储 器 ， 寄存 器 
通常 称 为 存储 体系 ( storage hierarchy， 或 称 为 存储 高 速 缓存 存储 器 〈 第 一 级 和 第 二 级 ) 
器 层次 结构 )， 如 图 A-4 所 示 。 关 于 存储 体系 的 传统 3 
视图 一 般 拥 有 三 个 级 别 : 主 存储 器 、 辅 助 存储 器 和 
第 三 级 存储 器 。 接 下 来 我 们 分 别 展开 进一步 的 讨论 。 

主 存储 器 由 主 内 存 (main memory， 简 称 主 存 或 





内 存 ) 以 及 通常 的 一 个 或 多 个 高 速 缓存 存储 器 (cache en 
memory， 或 简称 高 速 缓存 ) 组 成 ， 甚 至 有 时 候 处 理 | 淘 站 只 读 光盘 和 数字 化 视频 光盘 
器 寄存 器 也 被 认为 是 主 存 存储 体系 的 一 部 分 。 为 此 ， 一 
在 主 存储 器 中 ， 可 以 有 若干 级 别 。 如 果 我 们 认为 处 图 A-4 存储 器 层次 结构 


理 器 寄存 器 是 内 存 体系 的 组 成 部 分 ， 那 么 它们 应 当 处 于 最 顶层 。 在 下 一 级 别 是 高 速度 、 低 容 
量 的 高 速 缓存 存储 器 ， 其 通常 被 包括 为 处 理 器 芯片 自身 的 一 部 分 。 在 主 处 理 器 芯片 外 部 也 可 
能 存在 附加 的 高 速 缓存 存储 器 ， 但 其 存 取 速 度 要 慢 于 先前 级 别 的 高 速 缓存 存储 器 ， 而 存储 容 
量 要 大 于 先前 级 别 的 高 速 缓存 存储 器 。 在 更 低 的 级 别 上 ， 是 包含 在 一 个 或 多 个 单独 的 芯片 上 
的 较 低 速度 但 较 大 容量 的 主 存 。 高 速 缓存 存储 器 通常 使 用 被 称 为 静态 随机 存 取 存 储 器 (Static 
Random Access Memory，SRAM) 的 硬件 技术 ， 而 主 存 则 往往 使 用 动态 随机 存 取 存 储 器 
(Dynamic Random Access Memory，DRAM) 的 技术 。 与 动态 随机 存 取 存储 器 技术 相 比 ， 静 
态 随机 存 取 存储 器 技术 的 每 存储 单位 的 存 取 速 度 更 快 , 但 存储 成 本 更 贵 ©。 

处 理 器 寄存 器 比 高 速 缓存 存储 器 或 主 存 能 够 更 快 地 读 取 或 写 人 。 例 如 ， 在 精简 指令 集 计 
算 机 处 理 器 中 ， 寄 存 器 到 寄存 器 的 复制 仅仅 需要 耗费 单个 时 钟 周 期 即 可 完成 ， 寄 存 器 到 高 速 
缓存 存储 器 的 传输 需要 耗费 两 个 时 钟 周 期 ， 而 寄存 器 到 内 存 的 传输 则 可 能 需要 耗费 3 一 4 个 
时 钟 周期 。 

高 速 缓存 存储 器 通常 划分 为 两 部 分 : 用 于 存储 操作 数 的 数据 高 速 缓存 (data cache) 和 用 
于 存储 指令 的 指令 高 速 缓存 (instruction cache)。 在 某 些 情况 下 ， 会 为 在 用 户 模式 下 的 应 用 
程序 和 在 监管 模式 下 的 内 核 分 别 设 立 不 同 的 高 速 缓存 部 分 。 高 速 缓 存 和 处 理 器 之 间 的 字 节 传 
输 比 主 存 和 高 速 缓存 之 间 的 字 节 传输 要 快 若干 倍 。 因 此 ， 有 关 目 标 是 在 高 速 缓存 中 保持 存放 
有 当前 正在 使 用 的 数据 和 指令 。 这 项 任务 是 处 理 器 中 的 高 速 缓存 管理 电路 的 责任 ， 但 是 程序 
设计 也 可 能 会 影响 硬件 实施 高 速 缓存 所 需 指 令 和 数据 的 能 力 。 

内 存 容量 通常 按 KB (Kilobytes， 即 1024 字 节 )、MB ( Megabytes， 即 1 048 576 字 节 )、 
GB (Gigabytes， 即 1 073 741 824 字 节 ) 甚至 TB (Terabytes， 即 1 099 511 627 776 字 节 ) 来 
进行 度量 。 由 于 高 速 缓存 比 主 存 更 加 昂贵 ， 所 以 其 容量 往往 要 小 得 多 。 许 多 处 理 器 具有 两 
个 高 速 缓存 : 处 理 器 芯片 上 的 1 级 或 L1 高 速 缓存 (L1 cache)， 以 及 处 理 器 外 部 的 2 级 或 L2 
高 速 缓存 (L2 cache)。 有 些 处 理 器 甚至 还 拥有 在 处 理 器 外 部 的 第 三 级 的 L3 高 速 缓存 (L3 
cache)。 一 般 而 言 ， 较 高 级 别 ( 1 级 最 高 ，2 级 次 之 ，3 级 再 次 之 ， 以 此 类 推 ) 的 高 速 缓存 比 
较 低 级 别 的 高 速 缓存 更 快 ， 但 是 也 更 昂贵 并 且 保 存 较 少 的 信息 。 


日 内 存 、 处 理 器 和 磁盘 技术 总 是 在 不 断 地 发 展 变化 ， 故 而 在 任何 时 候 都 有 可 能 投入 使 用 更 新 的 技术 。 我 们 
不 会 就 不 同类 型 的 存储 器 是 如 何在 硬件 级 别 上 实际 构建 的 主题 展开 进一步 的 讨论 ， 因 为 这 与 我 们 所 介绍 
的 内 容 并 不 直接 相关 。 
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内 存 总 线 (memory bus) 是 处 理 主 存 (在 内 存世 片上) 和 高 速 缓存 存储 器 (在 处 理 器 
芯片 上 ) 之 间 的 数据 传输 的 硬 部 件 。 高 速 缓存 存 储 器 大 小 通常 在 64KB 到 若干 MB 之 间 的 
范围 内 ， 而 主 存 容量 则 往往 在 32MB 一 4GB 之 间 的 范围 内 。 不 过 ， 这 些 数字 还 在 继续 迅速 
增长 。 


A.3.3 辅助 存储 器 : 硬盘 


一 般 来 说 ， 处 于 存储 器 层次 结构 中 的 下 一 级 是 磁盘 硬盘 驱动 器 (magnetic disk hard- 
drive) 存储 器 部 件 或 直接 称 之 为 硬盘 (hard disk)。 硬 盘 比 主 存 访问 速度 慢 ， 但 是 具有 非常 大 
的 存储 容量 和 较 低 的 每 兆 字 节 成 本 。 硬 盘存 储 容 量 通常 在 10GB 一 1TB 的 范围 内 ， 也 可 能 会 
更 大 ， 而 且 相 关 数 字 同 样 也 在 继续 快速 增长 。 硬 盘 是 大 多 数 独立 的 计算 机 系统 的 一 部 分 ， 但 
是 通常 不 包括 在 诸如 个 人 数字 助理 、 音 乐 播放 器 、 电 话 、 汽 车 、 家 用 电器 等 各 种 设备 上 所 使 
用 的 内 入 式 系统 中 。 传 统 上 ， 寄 存 器 、 高 速 缓存 存储 器 和 主 存 一 起 被 称 为 主 存储 器 (primary 
storage)， 而 硬盘 则 被 称 为 辅助 存储 器 (secondary storage)。 每 个 系统 必须 拥有 一 个 主 存储 器 
部 件 。 

主 存储 器 和 辅助 存储 顺 之 间 的 重要 区 别 是 所 谓 的 存储 易 失 性 (storage volatility )。 在 易 
失 性 存储 器 〈volatile memory) 中 ， 当 电源 关闭 时 ， 存储器 的 内 容 将 会 丢失 。 而 在 非 易 失 性 
存储 器 (nonvolatile memory) 中 ， 当 电源 关闭 时 ， 存 储 器 的 内 容 仍 将 保持 和 继续 存在 。 大 多 
数 的 主 存储 器 系统 都 是 易 失 性 的 ， 而 大 多 数 的 辅助 存储 器 系统 都 是 非 易 失 性 的 。 因 此 ， 在 由 
于 电源 故障 而 导致 系统 崩 江 的 情况 下 ,磁盘 也 可 用 作 后 备 存储 器 介质 9。 

在 硬件 级 别 ， 主 存储 器 和 辅助 存储 器 之 间 的 数据 传输 牵涉 输入 / 输出 设备 控制 器 ， 我 们 
将 会 在 第 A.4 节 中 加 以 讨论 。 设 备 控制 器 通常 具有 存储 器 部 件 用 来 保存 在 磁盘 和 主 存 之 间 所 
传送 的 数据 。 此 类 存储 器 部 件 称 为 磁盘 高 速 缓存 (disk cache， 或 称 为 磁盘 缓存 ) 或 控制 器 高 
速 缓存 (controller cache， 或 称 为 控制 器 缓存 ) 。 

通常 情况 下 ， 因 为 设备 控制 器 拥有 自己 的 处 理 器 以 及 自己 的 不 与 处 理 器 时 钟 同步 的 时 
钟 ， 所 以 往往 需要 此 类 高 速 缓存 。 一 旦 处 理 器 启动 了 传输 操作 ， 处 理 器 将 会 把 对 传输 的 实际 
控制 交 给 输入 /输出 控制 器 ， 而 后 处 理 器 继续 执行 程序 。 因 此 ， 这 时 候 主 存 就 被 处 理 器 和 设 
备 控 制 器 一 起 访问 。 鉴 于 处 理 器 对 内 存 的 访问 请 求 被 赋予 更 高 的 优先 级 ， 所 以 设备 控制 器 
的 内 存 访 问 就 有 可 能 被 延迟 。 而 在 把 数据 从 磁盘 和 其 他 辅助 存储 器 设备 传送 到 主 存 的 时 候 ， 
设备 控制 器 高 速 缓存 可 通过 作为 缓冲 存储 器 来 防止 由 于 有 关 延 迟 而 导致 的 数据 丢失 。 设 备 
控制 器 高 速 缓存 也 存在 于 例如 软盘 和 光盘 等 某 些 类 型 的 第 三 级 存储 器 设备 的 输入 / 输出 控制 
器 中 ,具体 我 们 将 会 在 下 节 加 以 描述 。 男 外 ， 在 输入 /输出 控制 器 和 主 存 之 间 的 这 种 类 型 的 
数据 传输 可 以 使 用 我 们 在 第 14 章 中 所 讨论 的 内 存 直 接 存 取 (Direct Memory Access,DMA) 
技术 。 


A.3.4 第 三 级 存储 器 和 离线 存储 器 : 可 移动 磁盘 和 磁带 


在 许多 计算 机 系统 中 ， 还 存在 另 一 附加 的 存储 器 层级 ， 艾 如 用 于 备份 的 各 种 类 型 的 磁带 
存储 器 ， 有 时 被 称 为 第 三 级 存储 器 (tertiary storage) 或 离线 存储 器 ( offline storage， 或 称 为 
脱 机 存储 器 )。 另 外 ， 各 种 类 型 的 旋转 式 存储 器 ， 比 如 软盘 、 只 读 光 盘 (CD-ROM)、 读 写 式 


日 历史 上 ， 主 存储 器 不 一 定 是 易 失 性 的 。 特 别 地 ， 磁 芯 主 内 存 即使 在 电源 关闭 时 也 会 保持 其 内 容 
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光盘 (CD-RW)、 数 字 化 视频 光盘 (DVD) 等 9， 常 常 也 被 用 来 作为 保持 信息 的 存储 介质 。 存 
储 在 可 移动 介质 (主要 包括 可 移动 磁盘 和 磁带 ) 上 的 信息 往往 由 于 太 过 庞大 而 不 能 容纳 在 辅 
助 存储 器 上 ， 或 者 通常 并 不 经 常 需要 或 立即 需要 ， 故 而 并 不 是 长 期 保存 在 硬盘 上 。 为 此 ， 这 
类 数据 一 般 在 计算 机 系统 内 并 不 经 常 可 用 ， 即 不 像 在 高 速 缓存 存储 器 、 主 存 和 硬盘 一 一 它们 
被 称 为 在 线 存 储 器 ( online storage， 或 称 为 联机 存储 器 ) 一 一 中 的 信息 ， 后 者 只 要 在 计算 机 
系统 开启 的 时 候 就 可 使 用 。 

可 移动 介质 部 件 可 以 自动 化 ， 从 而 使 有 关 驱 动 器 能 够 从 插 人 驱动 器 的 许多 单独 介质 中 进 
行 选择 ， 相 关 例 子 包 括 自动 磁带 库 或 光盘 自动 点 唱机 。 在 这 种 情况 下 ， 它 们 适 于 被 称 为 第 三 
级 存储 器 。 未 被 自动 化 的 可 移动 介质 存储 部 件 通常 被 称 为 脱 机 存储 器 ， 因 为 必须 经 由 手动 方 
式 加 载 有 关 存 储 介质 (软盘 、 数 字 化 视频 光盘 、 只 读 光盘 、 磁 带 ) 后 才能 访问 相应 介质 上 的 
数据 。 第 三 级 存储 器 和 离线 存储 器 设备 也 可 以 被 视 为 输入 /输出 设备 (参见 第 A.4 节 )。 


A.3.5 ”存储 体系 的 管理 


存储 体系 的 各 个 层级 之 间 的 传输 通常 以 多 个 字 节 或 字 节 块 ( block) 为 单位 来 进行 。 主 存 
和 高 速 缓存 存储 器 之 间 的 块 大 小 (block size) 通常 在 16 字 节 (4 字 ) 到 256 字 节 (64 字 ) 之 
间 的 范围 内 ， 而 硬盘 和 主 存 之 间 的 块 大 小 通常 在 4KB 一 16KB 之 间 的 范围 内 甚至 会 更 大 些 。 
以 块 为 单位 而 不 是 以 单字 节 或 单字 为 单位 进行 传输 的 主要 原因 是 为 了 通过 减少 总 的 传输 时 
间 ， 从 而 改善 性 能 。 特 别 是 对 于 磁带 来 说 ， 磁 带 运动 的 开启 和 停止 操作 往往 会 带 来 很 大 的 开 
销 。 因 此 ， 每 次 读 或 写 时 ， 传 输 较 大 的 块 相 比 于 传输 较 小 的 块 的 效率 要 高 出 许多 。 同 样 ， 用 
来 访问 所 需 信 息 的 磁带 或 磁盘 定位 操作 往往 十 分 缓慢 。 一 次 传输 更 多 的 数据 则 意味 着 所 需要 
的 此 类 定位 操作 将 会 更 少 。 
还 可 以 通过 利用 局 部 性 原理 (locality principle) 来 改善 性 能 。 根 据 局 部 性 原理 ， 在 任何 
较 短 的 时 间 间 隔 中 ， 程 序 往往 倾向 于 访问 它们 的 指令 和 操作 数 的 一 小 部 分 。 这 一 局 部 性 特性 
已 经 体现 在 了 大 多 数 的 程序 当中 ， 并 且 具 体 表 现 为 两 个 方面 : 
e 时 间 局 部 性 ( temporal locality) : 根据 这 一 特性 ,一 道 程序 在 访问 某 些 存储 器 地 址 后 
可 能 很 快 又 会 再 次 访问 相应 的 存储 器 地 址 。 例 如 ， 循 环 体内 的 那些 指令 可 能 在 短 时 
间 段 内 被 多 次 重复 访问 。 

。 空间 局 部 性 (spatial locality): 根据 这 一 特性 ， 如 果 一 道 程序 访问 了 某 些 存储 器 地 址 ， 
那么 其 可 能 很 快 会 访问 存储 在 附近 的 其 他 字 。 例 如 ， 指 令 通常 被 顺序 地 存储 和 访问 。 
再 比如 ， 程 序 可 能 处 理 连 续 存 储 的 操作 数 (数据 )， 具 体 如 访问 连续 的 数组 元 素 或 顺 
序 扫描 正在 编辑 的 文本 块 。 

如 果 存 储 在 块 中 的 空间 上 邻近 的 多 个 字 被 加 载 到 了 高 速 缓存 存储 器 中 ;那么 在 需要 的 情 
况 下 对 后 续 的 字 的 访问 将 会 是 相当 快 的 ， 因 为 它们 已 经 存在 于 高 速 缓存 中 了 。 这 种 情况 被 称 
为 高 速 缓存 命中 (cache hit) 。 另 一 方面 ， 如 果 这 些 后 续 的 字 从 未 被 访问 ， 那 么 将 它们 加 载 到 
高 速 缓存 中 的 成 本 将 会 被 浪费 。 而 当 引 用 不 在 高 速 缓存 存储 器 中 的 指令 或 操作 数 时 ， 有 关系 
统 将 试图 在 主 存储 器 中 找到 它们 并 把 它们 传送 到 高 速 缓 存 中 。 这 种 情况 被 称 为 高 速 缓 存 未 命 
中 (cache miss)。 


如 果 引 起 高 速 缓存 未 命中 的 字 还 不 在 主 存 中 ,那么 其 一 定 存储 在 硬盘 上 ， 故 而 需要 首先 


日 CD-ROM 代表 Compact Disc-Read Only Memory， 即 只 读 光盘 存储 器 ; CD-RW 代表 Compact Disc-Read 
Write， 即 读 写 式 光盘 ; DVD 代表 Digital Video Disc， 即 数字 化 视频 光盘 。 
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将 其 传送 到 主 存 中 ,然后 再 将 所 需 部 分 传送 到 高 速 缓存 中 。 因 此 ， 有 必要 找到 降低 每 存储 单 
位 的 访问 成 本 的 适当 的 块 大 小 。 通 常情 况 下 ， 采 用 一 次 性 传输 方式 在 一 个 级 别 和 下 一 个 级 别 
之 间 传 输 n 个 连续 字 节 或 字 的 成 本 要 远 低 于 使 用 多 次 传输 方式 来 传输 它们 的 成 本 。 这 对 于 在 
硬盘 和 主 存 之 间 的 传输 尤其 如 此 ， 并 且 对 于 在 主 存 和 高 速 缓存 存储 器 之 间 的 传输 而 言 在 较 小 
程度 上 也 是 如 此 。 我 们 应 当 看 到 ， 操 作 系统 的 内 存 管理 模块 的 主要 部 分 就 是 试图 优化 各 种 类 
型 的 传输 。 一 般 来 讲 ， 操 作 系 统 负责 处 理 硬盘 和 主 存 之 间 的 传输 ， 而 处 理 器 硬件 负责 处 理 内 
存 到 高 速 缓存 的 传输 。 


A.3.6 存储 保护 


存储 保护 ( memory protection， 或 称 为 内 存 保护 ) 部 件 是 主 存 与 操作 系统 特别 相关 的 另 
一 方面 。 当 一 道 正 在 执行 的 程序 引用 某 存 储 器 单元 时 ， 操 作 系统 需要 确保 该 存储 器 单元 是 该 
程序 的 地 址 空间 ( address space) 的 一 部 分 。 也 就 是 说 ， 应 当 禁 止 应 用 程序 引用 正在 由 其 他 
程序 或 操作 系统 本 身 所 使 用 的 存储 器 单元 。 这 样 才能 保护 操作 系统 和 其 他 用 户 程 序 及 数据 免 
受 错误 程序 或 恶意 程序 的 破坏 。 

一 种 用 于 存储 保护 的 技术 是 使 用 一 对 寄存 器 ， 即 基 址 寄存 器 和 界限 寄存 器 (limit register)， 
如 图 A-5 所 示 。 在 一 道 程序 开始 执行 之 前 ， 操 作 系 统 应 当 设置 这 两 个 寄存 器 以 界定 包含 对 应 
程序 地 址 空间 的 存储 器 地 址 。 用 来 设置 基 址 寄存 器 和 界限 寄存 器 的 内 容 的 指令 是 特权 指令 ， 
只 有 在 操作 系统 内 核 中 上 且 处 理 器 处 于 监管 模式 时 才能 使 用 。 一 旦 操作 系统 将 执行 模式 设置 为 
用 户 模式 并 将 控制 权 转 移 给 了 用 户 程 序 ， 那 么 基 址 寄存 器 和 界限 寄存 器 都 将 不 能 改变 。 而 对 
相应 范围 之 外 的 存储 器 单元 的 任何 引用 都 将 导致 一 个 用 来 指示 发 生 了 无 效 存储 器 引用 的 硬件 
中 断 。 每 当 将 执行 控制 权 转 移 到 另 一 道 程序 时 ， 操 作 系统 将 重新 设置 基 址 寄存 器 和 界限 寄存 器 。 

在 许多 现代 系统 中 ， 往 往 使 用 了 更 为 复杂 的 方案 。 内 存 被 划分 为 相等 大 小 的 内 存 页 面 
( memory page)。 典 型 的 内 存 页 面 大 小 一 般 从 512 字 节 到 4096 字 节 (4KB ) 不 等 。 这 项 技术 
采用 了 页 表 (page table)， 而 页 表 是 用 来 指向 可 由 当前 正在 执行 的 用 户 程序 所 访问 的 特定 内 
存 页 面 的 数据 结构 。 只 有 通过 有 关 页 表 所 引用 的 那些 存储 器 单元 才能 被 相应 程序 所 访问 。 页 
表 通 过 处 理 器 自身 内 部 的 硬件 支持 来 加 以 实现 。 同 样 ， 加 载 页 表 的 内 容 的 命令 也 是 只 能 由 处 
于 监管 模式 下 的 操作 系统 内 核 才 能 执行 的 特权 指 


令 。 我们 在 第 10 章 和 第 11 章 中 曾经 详细 讨论 了 
这 种 存储 保护 技术 以 及 其 他 的 存储 保护 技术 。 地 址 空间 
A.4 输入 和 输出 

输入 和 输出 系统 是 把 主 存 和 处 理 器 连接 到 其 


他 设备 的 部 件 ， 它 们 有 时 被 称 为 输入 /输出 设备 「 基 大 
(IO device) 或 外 围 设备 (peripheral device ) 。 
程序 2 地 址 空间 


A.4:1 输入 /输出 设备 的 类 型 
输入 /输出 设备 可 被 划分 为 四 大 类 : 用 户 接 i 

口 设 备 (user interface device)、 存 储 设备 (storage 

device)、 网 络 设备 ( network device) 以 及 计算 机 ”图 A-5 利用 基 址 寄存 器 和 界限 寄存 器 的 

控制 型 设备 。 内 存 保 护 机 制 
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用 户 接口 型 输入 / 输出 设备 (user interface IO device): 它们 用 来 实现 用 户 与 计算 机 
系统 之 间 的 交互 。 服 务 于 用 户 和 系统 之 间 直 接 交 互 的 设备 包括 键盘 、 指 针 式 设备 ( 例 
如 鼠标 、 轨 迹 球 、 触 摸 屏 或 触摸 板 )、 操 纵 杆 、 话 简 (语音 或 声音 输入 )、 用 于 输入 的 
其 他 类 似 部 件 ， 以 及 视频 监视 器 、 扬 声 器 (语音 或 声音 输出 ) 和 用 于 输出 的 其 他 类 似 
部 件 。 还 有 其 他 的 一 些 输入 /输出 设备 支持 间接 交互 ， 例 如 用 于 视频 或 图 像 输 入 的 数 
码 相 机 和 扫描 仪 以 及 用 于 硬 拷贝 或 胶片 输出 的 打印 机 和 绘图 仪 。 
存储 型 输入 /输出 设备 (storage IO device): 它们 用 于 存储 信息 ， 故 而 被 认为 既是 输 
入 /输出 设备 ， 又 是 存储 体系 的 组 成 部 分 。 它 们 具体 包括 磁盘 (硬盘 或 软盘 )、 光 盘 
(optical disc) /数字 化 视频 光盘 、 磁 带 、 闪 存 芯片 ， 等 等 。 
网 络 型 输入 / 输出 设备 (network:IO device) : 它们 用 于 将 计算 机 系统 连接 到 网 络 上 ， 
具体 包括 模拟 电话 调制 解 调 器 .数字 用 户 线路 连接 、 电 费 调 制 解 调 器 和 有 线 电 缆 。 
此 外 ， 诸 如 红外 线 或 蓝牙 之 类 的 无 线 连接 正 变 得 越 来 越 普遍 ， 它 们 可 以 使 用 安装 在 
计算 机 或 设备 中 的 无 线 网 卡 来 连接 到 无 线 集 线 器 上 ， 而 无 线 集线器 又 进一步 连接 到 
网 络 上 ， 或 者 它们 也 可 以 直接 将 设备 连接 到 计算 机 上 。 
受 控 型 设备 (controlled device) : 计算 机 经 常 被 用 来 控制 非 计算 型 设备 ,具体 包括 电 
机 、 上 暖气、 空调 、 照 明显 示 器 ， 等 等 。 骨 人 式 计 算 机 系统 也 可 归 为 这 一 类 型 。 

正如 我 们 可 以 看 到 的 那样 ， 存 在 各 种 各 样 的 输入 /输出 设备 ， 并 且 不 时 地 会 引信 新 的 设 
备 。 为 了 应 对 输入 /输出 设备 的 这 种 激增 问题 ， 人 们 试图 努力 实现 单一 接口 的 标准 化 ， 以 便 
能 够 接 人 各 种 不 同类 型 的 输入 /输出 设备 。 通 用 串 行 总 线 ( Universal Serial Bus, USB) 2.0 
标准 就 是 这 样 的 一 种 标准 ， 甚 支持 4.80 亿 比 特 每 秒 ( bits per second，bps) 的 输入 /输出 传 
输 速 率 ， 故 而 适用 于 连接 从 键盘 到 数字 摄像 机 或 外 部 硬盘 驱动 器 等 各 种 设备 。 另 一 种 标准 是 
IEEE 1394， 其 也 允许 高 达 4.00 亿 比 特 每 秒 的 传输 速率 并 且 用 于 连接 相同 类 型 的 设备 。 这 一 
接口 有 两 个 被 人 熟知 的 专利 名 称 ， 分 别 是 苹果 公司 的 FireWire (火线 ) 和 索尼 公司 的 i.Link 
( 爱 点 连接 )。 对 于 较 高 速度 的 设备 而 言 ， 火 线 接口 比 通用 串 行 总 线 接口 更 为 高 效 ， 故 而 火线 
接口 通常 用 于 连接 摄像 机 ， 并 被 选 为 用 于 音频 / 视频 部 件 通信 和 控制 的 标准 连接 接口 。 


A.4.2 设备 控制 器 和 设备 驱动 程序 


设备 控制 器 ( device controller) 是 将 输入 /输出 设备 连接 到 计算 机 处 理 器 和 内 存 的 接口 
部 件 。 设 备 控制 器 往往 包含 了 自己 的 具有 专用 指令 集 的 处 理 器 ， 而 设备 制造 商 常 常 使 用 该 指 
令 集 来 编写 用 于 控制 输入 /输出 设备 的 程序 。 设 备 控制 器 通常 还 拥有 一 个 命令 集 ( command 
set)， 即 操作 系统 可 以 经 由 系统 总 线 发 送 给 控制 器 用 以 控制 输入 /输出 设备 的 命令 的 集合 。 
这 些 命令 往往 仅 限 于 由 操作 系统 的 设备 驱动 程序 (device driver) 使 用 ， 并 且 通 常 不 能 由 应 
用 程序 或 系统 程序 员 所 访问 。 此 外 ， 许多 设备 控制 器 还 具有 称 为 控制 器 高 速 缓存 (controller 
cache， 或 称 为 控制 器 缓存 ) 的 存储 器 部 件 (参见 第 A.3.3 节 )。 

一 方面 ,诸如 通用 串 行 总 线 接口 和 火线 接口 之 类 的 标准 设备 控制 器 通常 可 用 于 连接 到 支 
持 相 应 标准 的 任何 类 型 的 输入 /输出 设备 十 。 男 一 方面 ,一 些 专 用 的 设备 控制 器 (例如 磁盘 
控制 器 或 图 形 视频 控制 器 ) 则 只 能 连接 到 对 应 设计 所 支持 的 单一 类 型 的 输入 /输出 设备 上 9。 


日 ”在 某 些 情况 下 ， 控 制 器 仅仅 限于 连接 某 种 类 型 的 设备 的 子 集 ， 例 如 ，ATA 控 制 器 仅 可 与 ATA 磁盘 驱动 器 
而 不 是 所 有 类 型 的 磁盘 驱动 器 协同 工作 。 有 时 控制 器 只 能 使 用 来 自 单一 制造 商 的 设备 ， 或 者 甚至 仅 可 使 
用 特定 型 号 的 设备 。 
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一 般 来 说 ,控制 器 用 来 处 理 与 输入 /输出 设备 之 间 的 交互 ， 并且 在 数据 从 计算 机 主 存 传 输 到 
设备 或 者 从 设备 传输 到 主 存 的 时 候 ， 有 关 控 制 器 可 以 
使 用 自己 的 存储 器 来 缓冲 (或 缓存 ) 有 关 数 据 。 同 时 ， 
控制 器 的 命令 集 往往 包含 有 用 来 启动 输入 (或 输出 ) 
操作 的 命令 。 例 如 ， 硬 盘 控 制 器 通常 拥有 命令 用 来 实 
现 针对 特定 磁盘 块 地 址 的 盘 块 读 取 操 作 的 启动 ， 有关 
命令 同时 并 需 提 供用 于 保存 对 应 盘 块 的 计算 机 内 存 绥 
冲 地 址 。 图 A-6 是 用 来 说 明 相关 概念 的 简化 示意 图 。 

在 计算 机 这 一 边 ， 操 作 系 统 则 往往 会 处 理 与 设备 
控制 器 之 间 的 所 有 交互 。 正 如 刚才 所 提 到 的 ,操作 系 
统 中 用 来 与 设备 控制 器 进行 交互 以 及 处 理 输入 /输出 的 模块 称 为 设备 驱动 程序 。 各 设备 驱动 
程序 应 当 被 设计 成 用 于 处 理 特定 设备 控制 器 的 低级 硬件 指令 和 详细 信息 。 换 句 话说， 设备 驱 
动 程序 将 会 为 操作 系统 的 其 他 部 分 呈现 有 关 设 备 的 一 个 抽象 和 统一 的 视图 。 


A.4.3 输入 /输出 设备 的 其 他 分 类 及 连接 


还 可 以 采用 其 他 方法 来 对 输入 /输出 设备 进行 分 类 。 一 种 分 类 方法 是 根据 设备 与 计算 机 
之 间 的 连接 类 型 而 将 它们 划分 开 来 。 进一步 说 ;输入 /输出 设备 在 硬件 连接 级 别 方面 往往 采 
用 串 行 或 并 行 的 物理 连接 (通常 为 电缆 ) 方式 连接 到 内 存 和 处 理 器 上 。 其 中 ， 串 行 ( serial) 
连接 通过 单一 的 一 根 线 以 串 行 方式 来 传输 二 进 制 位 ; 而 并 行 ( parallel) 连接 则 通常 利用 多 根 
线 以 每 次 8 位 (或 甚至 更 多 的 ) 二 进 制 位 的 方式 来 并 行 地 传输 。 与 简单 输入 /输出 设备 ( 璧 
如 键盘 :鼠标 或 调制 解 调 器 ) 的 接 日 通常 采用 串 行 连接 方式 ， 而 诸如 硬盘 小 型 计算 机 系统 接 
口 之 类 的 高 速 设备 的 连接 则 往往 采用 并 行 电缆 方式 。 需 要 说 明 的 是 ， 尽 管 通用 串 行 总 线 和 火 
线 的 控制 器 均 采 用 串 行 电缆 ,但 由 于 其 电缆 是 高 等 级 和 有 屏蔽 防护 的 ， 故 而 可 以 支持 相关 控 
制 器 的 高 速 的 数据 传输 。 

男 二 种 更 高 级 别 的 分 类 方法 是 把 输入 /输出 设备 划分 成 每 次 传输 多 个 字 节 的 块 设备 
(block device) 和 每 次 传输 单个 字符 或 字 节 的 字符 设备 ( character device)。 磁 盘 是 一 种 典型 
的 块 设备 ， 而 键盘 则 是 一 种 典型 的 字符 设备 。 

第 三 种 分 类 方法 是 根据 相关 连接 是 通过 有 线 方式 还 是 无 线 方式 来 进行 划分 。 当 前 ， 便 携 
式 计算 机 与 网 络 之 间 的 连接 或 者 是 与 诸如 打印 机 之 类 的 输出 设备 之 间 的 连接 ， 就 越 来 越 多 地 
采用 了 无 线 连接 方式 。 


A.5 网 络 

许多 计算 机 往往 都 会 连接 到 某 种 网 络 土 。 在 抽象 层面 上 ， 可 以 认为 网 络 连接 就 类 似 于 计 
算 机 的 处 理 器 和 内 存 可 以 连接 到 输入 /输出 设备 的 方式 。 然 而 ， 网 络 允 许 计 算 机 连接 到 其 他 
的 计算 机 上 ， 也 允许 计算 机 与 连接 到 网 络 上 的 其 他 设备 进行 连接 。 故 而 ， 这 种 连接 支持 用 户 
访问 其 他 计算 机 上 的 功能 和 信息 ， 并 使 用 他 们 自己 的 计算 机 上 所 没有 的 设备 ， 同 时 这 种 连接 
还 允许 在 不 同 计算 机 上 运行 的 进程 之 间 交 换 信息 。 


A.5.1 客户 端 - 服务器 模型 、 对 等 模型 及 多 层 模 型 
一 种 常见 的 方式 是 通过 客户 端 - 服务 器 模型 ( client-server model) 来 审视 网 络 交互 。 其 





图 A-6 输入 /输出 设备 经 由 设备 控制 
器 连接 到 内 存 和 处 理 器 的 方式 
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间 ， 一 台 计 算 机 一 一 通常 是 用 户 所 在 的 计算 机 一 一 被 称 为 客户 端 ( client)。 客户 端 可 以 访问 
一 台 或 多 台 服 务 器 ( server) 计算 机 以 访问 有 关 服 务 器 所 提供 的 信息 或 其 他 功能 。 服 务 器 可 
能 包括 以 下 任何 功能 : 

e 包含 有 大 量 信息 的 数据 库 服 务 器 。 

e 支持 客户 端 访问 互联 网 上 的 文档 的 万 维 网 服务 器 (Web server, 或 称 为 网 站 服务 器 )。 

e 支持 用 户 在 各 种 打印 机 上 进行 打印 的 打印 机 服务 器 。 

e 用 来 管理 用 户 文件 的 文件 服务 器 。 

e 用 于 存储 和 转发 电子 邮件 的 电子 邮件 服务 器 。 

e 支持 诸如 文字 处 理 或 电子 表格 之 类 的 应 用 程序 的 服务 器 。 

关于 网 络 交互 的 另 一 种 模型 是 对 等 模型 (peer-to-peer model)， 其 中 所 有 的 计算 机 都 被 认 
为 是 地 位 平等 的 。 例 如 ， 相 关 计算 机 可 以 协作 解决 一 个 大 型 的 计算 问题 ， 且 对 应 问题 应 被 设 
计 成 是 通过 网 络 上 的 多 人 台 计 算 机 以 分 布 方式 运行 而 加 以 处 理 。 

随 着 分 布 式 系统 的 发 展 ， 常 常 有 必要 构建 比 上 述 模 型 更 为 复杂 的 模型 。 大 型 的 应 用 程序 
通常 被 设计 成 多 层 ( multiple tier) 模型 。 在 典型 的 三 层 设计 方案 中 ,往往 会 有 一 个 负责 用 户 
界面 的 前 端 ， 一 个 包含 有 关 应 用 主要 逻辑 一 一 通常 称 为 业务 规则 ( business rule) 的 中 
间 层 (middle tier) 以 及 一 个 负责 有 关 应 用 所 有 数据 存储 的 数据 库 层 (database tier)。 在 第 17 
章 中 ， 我 们 曾经 讨论 了 演化 形成 这 些 更 为 复杂 的 架构 的 基本 理由 。 而 相关 模型 则 在 关于 网 络 
的 第 15 章 以 及 关于 分 布 式 处 理 系统 的 第 7 章 和 第 17 章 曾 有 过 较为 详尽 的 讨论 。 


A.5.2 网络 控制 器 、 路 由 器 和 域名 服务 器 


类 似 于 计算 机 与 用 来 控制 输入 /输出 设备 的 设备 控制 器 之 间 的 交互 方式 ， 处 理 器 和 内 
存 通过 网 络 接口 控制 器 (Network Interface Controller，NIC) 连接 到 网 络 上 。 在 硬件 层级 
( hardware level)， 存 在 着 各 种 类 型 和 不 同 速度 的 网 络 连接 ， 并 且 一 直 在 不 断 地 引入 各 种 用 于 
连接 的 新 型 技术 。 将 计算 机 连接 到 网 络 的 一 些 常见 的 硬件 设备 和 技术 包括 调制 解 调 器 、 以 太 
网 、 数 字 信 号 线路 、 电 缆 调 制 解 调 器 以 及 若干 无 线 技术 。 

在 物理 层级 ， 区 分 用 于 构建 网 络 的 两 种 类 型 的 连接 一 一 有 线 方 式 和 无 线 方式 一 一 是 非常 
有 用 的 。 用 于 有 线 网 络 ( wired network) 的 硬件 包括 不 同类 型 的 电缆 或 光纤 、 网 络 网 关 、 路 
由 器 、 交 换 机 、 集 线 器 以 及 其 他 类 似 的 部 件 。 而 无 线 网 络 ( wireless network) 部 件 则 包括 卫 
星 、 用 于 无 线 连接 的 基站 、 无 线 集线器 以 及 红外 端口 和 蓝牙 端口 等 。 

网 络 可 以 通过 利用 网 桥 (bridge)、 交 换 设备 ( switching device) 或 路 由 器 (router) 将 消 
息 从 甚 源 端点 按照 规定 线路 传送 到 其 目的 端点 。 为 了 解决 管理 方面 的 复杂 性 ， 通 常 将 一 个 
组 织 机 构 内 部 的 网 络 划分 为 若干 子 网 络 ， 且 每 个 子 网 络 通过 局 域 网 (Local Area Network， 
LAN) 来 连接 少量 的 计算 机 。 这 些 子 网 络 通过 本 地 路 由 器 (local router) 相互 连接 ， 并 通过 
本 地 路 由 器 连接 到 区 域 路 由 器 (regional router) 上 ， 而 对 应 的 区 域 路 由 器 则 经 由 一 个 或 多 个 
附加 的 互联 网 路 由 器 (Internet router) 与 全 球 网 络 的 其 余部 分 进行 连接 。 

对 于 互联 网 来 说 ， 网 络 上 的 每 台 计 算 机 均 拥 有 一 个 数字 式 网 际 协议 ( Internet protocol， 
IP) 地 址 (例如 192.168.2.1 ), 该 地 址 用 来 唯一 地 标识 相应 的 计算 机 , 并且 支持 有 关 网 络 把 
寻 址 到 该 网 际 协议 地 址 的 消息 按 规定 线路 传送 给 对 应 的 计算 机 。 与 此 同时 ,计算 机 也 拥有 
一 个 唯一 的 名 称 ， 辟 如 ourserver.example.com。 而 称 为 域名 服务 器 ( Domain Name Server， 
DNS) 的 专用 服务 器 拥有 相关 数据 库 ， 可 以 支持 在 给 定 计算 机 名 称 时 找到 其 对 应 的 数字 式 网 
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际 协议 地 址 。 在 此 基础 上 ， 连 接 在 网 络 上 的 其 他 的 专用 计算 机 ， 即 路 由 器 和 交换 设备 ， 就 可 
以 根据 目的 端点 的 数字 式 网 际 协 议 地 址 或 介质 访问 控制 .(Media Access Control，MAC ) 地 址 
找到 相应 的 路 径 ， 进 而 通过 网 络 而 把 消息 传送 到 目标 计算 机 。 期 间 ， 这 些 设备 使 用 各 种 级 别 
的 特定 的 网 络 协议 来 物理 地 传递 消息 。 为 说 明 有 关 概 念 ， 图 A-7 给 出 了 一 个 简化 的 示意 图 。 
另外 ,完成 相关 路 由 和 交换 的 技术 曾经 在 第 15 章 中 讨论 过 。 








广域网 、、 
互联 网 
图 A-7 网 络 与 各 种 计算 机 的 连接 


A.5.3 “网 络 分 类 


我 们 以 各 种 网 络 类 型 的 传统 特征 描述 来 对 这 里 关于 网 络 的 概要 介绍 加 以 总 结 9。 

局 域 网 (Local Area Network, LAN) 是 指 通常 对 位 于 有 限 地 理 区 域 范围 内 例如 ， 某 
组 织 机 构 的 一 组 办 公 室 内 或 一 栋 建 筑 物 内 或 多 栋 相 邻 的 建筑 物 内 一 一 的 计算 机 进行 连接 而 形 
成 的 网 络 。 有 关 网 络 主要 基于 穿 过 建筑 物 和 在 建筑 物 之 间 延 伸 的 电缆 而 构建 形成 ， 也 可 能 包 
括 连 接 到 每 层 (或 每 组 相 邻 办 公 室 ) 的 各 种 网 络 的 交换 机 或 路 由 器 。 需 要 说 明 的 是 ， 越 来 越 
多 地 使 用 无 线 接 入 点 〈wireless access point) 来 支持 计算 机 通过 无 线 网 卡 而 连接 到 局 域 网 上 。 

另 一 方面 ， 广 域 网 ( Wide Area Network，WAN) 通常 是 指 对 分 布 在 较 广阔 的 地 理 区 域 
范围 内 的 计算 机 进行 连接 而 形成 的 网 络 。 有 关 网 络 采 用 电话 线 、 光 纤 电 缆 、 卫 星 和 其 他 连接 
部 件 而 将 成 千 上 万 个 局 域 网 彼此 连接 到 一 起 ， 从 而 支持 全 球 范围 内 的 计算 机 的 相互 连接 。 

移动 网 络 ( mobile network) 由 成 千 上 万 个 作为 固定 基站 进行 运营 的 电信 塔 和 控制 系统 
所 组 成 ， 而 这 些 基 站 又 连接 到 了 局 域 网 或 广域网 上 。 诸 如 手机 或 手持 式 计算 机 或 个 人 数字 助 
理 之 类 的 移动 设备 可 以 连接 到 一 个 邻近 的 基站 上 ， 并 通过 该 基站 与 网 络 的 其 余部 分 相连 接 ， 
同时 与 全 球 网 络 的 其 他 部 分 相互 连接 到 了 一 起 。 


A.6 系统 结构 详 图 
最 后 ， 我 们 以 图 A-8 结束 本 附录 ， 该 图 就 我 们 在 附录 中 所 讨论 的 各 种 系统 部 件 之 间 的 相 





号 “局 域 网 和 广域网 之 间 的 技术 区 别 会 有 些 不 同 ， 详 见 第 15 章 相关 内 容 。 
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互 连 接 给 出 了 更 为 详细 的 展示 。 
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图 A-8 计算 机 系统 组 成 结构 详 图 


A.7 小 结 


在 本 附录 中 ， 我们 概述 了 计算 机 系统 的 基本 组 成 部 件 。 我 们 从 典型 计算 机 系统 组 成 部 件 
的 一 个 简单 概述 和 结构 图 出 发 ， 最 终 总 结 形成 
构图 。 在 其 间 ， 我 们 就 现代 计算 机 系统 的 主要 组 成 部 件 包括 处 理 器 、 内 存 和 存储 体系 、 输 入 / 
输出 设备 以 及 网 络 ， 按 照 一 节 介 绍 一 个 部 件 的 方式 分 别 进 行 了 解释 说 明 。 从 论述 过 程 中 ， 相 
关内 容 彼此 之 间 无 疑 会 存在 某 些 重复 。 例 如 ， 硬 盘 既 可 以 被 认为 是 输入 /输出 设备 ， 也 可 以 
被 认为 是 存储 体系 的 组 成 部 分 ， 同 时 ， 计 算 机 的 网 络 接口 也 可 以 被 抽象 和 认为 是 输入 /输出 
设备 。 尽 管 如 此 ， 传 统 的 划分 方案 对 于 很 好 地 结构 化 及 编排 组 织 我 们 关于 计算 机 系统 和 操作 
系统 的 相关 讨论 和 陈述 却 是 非常 有 用 的 。 
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A.l 
A.2 
A.3 
A.4 
A.5 
A.6 
A,7 


A.8 


A.9 


A.10 
A.11 


A.12 


关于 处 理 器 设计 的 两 种 主要 类 别 是 什么 ? 

就 操作 系统 设计 和 开发 的 讨论 而 言 ， 指 令 集 体系 结构 有 何 重要 意义 ? 

为 什么 系统 硬件 定时 器 对 操作 系统 非常 重要 ? 

中 断 的 目的 是 什么 ? 

多 核 处 理 器 芯片 的 意义 是 什么 ? 

计算 机 中 的 主 存储 器 总 是 由 电子 存储 器 电路 组 成 的 。 这 是 否 正 确 ? 

缓存 机 制 对 操作 系统 性 能 极为 重要 , 无 论 怎样 强调 也 不 为 过 ， 也 很 难 夸大 。 

a. 缓存 的 目的 是 什么 ? 

b. 缓存 功能 所 依赖 的 理论 基础 是 什么 ? 

从 理论 上 讲 ， 我 们 可 以 让 在 辅助 存储 器 和 主 存储 器 之 间 的 缓存 与 辅助 存储 器 一 样 大 。 这 将 会 大 大 
减少 有 关 的 延 时 。 但 为 什么 我 们 不 这 样 做 呢 ? 

内 存 保护 的 目的 是 什么 ? 

拥有 设备 控制 器 的 目的 是 什么 ? 

为 了 帮助 我 们 讨论 和 理解 诸如 输入 /输出 设备 之 类 的 复杂 主题 ， 我 们 可 以 把 有 关 主 题 作 为 一 个 
具有 多 个 维度 的 空间 来 看 待 。 我 们 首先 根据 设备 的 目的 讨论 了 关于 输入 /输出 设备 的 一 种 宽泛 
的 分 类 。 期 间 所 讨论 的 三 种 宽泛 的 目的 是 什么 呢 ? 请 分 别 给 出 每 种 类 别 的 一 些 例子 。 

我 们 还 根据 相关 接口 是 通用 接口 还 是 特定 设备 类 型 接口 而 把 输入 /输出 设备 空间 进行 了 划分 。 
请 分 别 给 出 每 种 类 别 的 一 些 例子 。 

与 不 使 用 内 存 直 接 存 取 机 制 的 控制 器 相 比 ， 内 存 直 接 存 取 型 控制 器 可 以 使 得 由 于 在 设备 和 主机 
之 加 数据 块 的 传输 所 引发 的 中 断 次 数 大 大 减少 。 除 了 可 以 明显 地 把 处 理 器 解放 出 来 做 其 他 事情 
之 外 ， 我 们 需要 使 用 内 存 直 接 存 取 型 控制 器 的 理由 还 有 哪些 呢 ? 

设备 驱动 程序 的 功能 是 什么 ? 我 们 如 何 配 置 操作 系统 来 使 用 正确 的 驱动 程序 呢 ? 

利用 什么 机 制 来 将 诸如 omega.example.com 之 类 的 计算 机 名 称 转换 为 网 际 协议 地 址 以 便 在 网 络 
中 使 用 呢 ? 
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Abstract virtual machines (抽象 虚拟 机 )，393-394 
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369f 
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Mac (苹果 公司 Mac 操作 系统 )，104 
Script (苹果 脚本 语言 )，102 
Share (苹果 共享 机 制 )，98，102 
68030 (苹果 68030 处 理 器 )，102 
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Application programmers” View (应 用 程序 员 视图 )， 
9 
Application specific integrated circuits ( ASIC, 专用 
型 集成 电路 )，347 
Application users (应 用 型 用 户 )，6 
Application virtual machines (应 用 级 虚拟 机 )，39- 
40 
Architectural approach to building OS (操作 系统 构 
建 方法 )，33-35; 34f，35f 


Architecture of Palm ( Palm 操作 系统 体系 结构 )， 
72f 

Archive bit (归档 位 )，372 

ARCNET (附属 资源 计算 机 网 络 协议 )，337， 
346，348 

Arithmetic and logic unit (ALU， 算 术 逮 辑 部 件 )， 
490 

ARM processor (ARM 处 理 器 )，476，480，486 

ASCII (美国 信息 交换 标准 代码 )，339，340，364 

Assembly language (汇编 语言 )，491 

Associated reference count (所 关联 的 引用 计数 )， 
243f 

Associative memory (关联 存储 器 ， 又 称 为 联想 存 
储 器 )，228 

Asymmetric algorithm ( 非 对 称 算 法 )，375 

Asymmetric key encryption ( 非 对 称 密 钥 加 密 )，375- 
376，376f 

Asymmetric multiprocessing ( 非 对 称 多 处 理 )，105， 
125，194 

Asynchronicity (异步 性 )，5 

Asynchronous attributes (异步 通信 属性 )，185，187- 
188 

Asynchronous event (异步 事件 )，494 

Asynchronous read (异步 读 取 方式 )，188 

Asynchronous transfer mode ( ATM， 异 步 传输 模 
式 )，348，441，457 

ATA (高 技术 连接 系统 接口 ， 或 称 为 高 技术 附加 
装置 )，439，502n 

Athene (Athene 操作 系统 )，38 

Athlon ( 速 龙 处 理 器 )，137 

At least once semantics (至 少 一 次 性 语义 )，408 

At mostionce semantics (至 多 一 次 性 语义 )，408 

Atomic (原子 化 ， 或 称 为 原子 性 质 的 )，191-192 

AT&T (美国 电话 电报 公司 )，114 

Attribute list (属性 列表 )，431 

Attributes (属性 )，428 

Audio 1/O (音频 输入 /输出 )，472 

Authentication (认证 )，367-368 

Authorization (授权 )，368-370，368f，369f 

Automatic page limit balancing (页 面 限 值 自动 平 
衡 )，245，246f 

Auto mounting ( 自动 挂 载 )，288 

Average response time (平均 响应 时 间 )，160 

Average turnaround time (平均 周转 时 间 )，160 


Average wait time (平均 等 待 时 间 )，161 
Avoidance ( 死 锁 避 免 )，203-204 
Axis Communication ( 安 讯 士 公司 )，446 
B 
Backbone (主干 网 )，348 
Background (后 台 )，63，243 
Backing store (后 备 存储 器 )，243 
Backups，system (备份 ， 系 统 )，371-372 
Backward compatibility (向 后 兼容 ,或 称 为 向 下 
兼容 )，41 
Banker's Algorithm (银行 家 算法 )，204 
Banyan (Banyan 系统 )，345 
Base file record (基本 文件 记录 )，286 
Base priority class (基本 优先 级 类 别 )，423 
Base register ( 基 址 寄存 器 )，213，492，501 
Base register addressing( 基 址 寄存 器 寻 址 )，487 
Basic input/output system ( BIOS， 基 本 输入 /输出 
系统 )，13，49-50，82、96 
Basic memory management (基本 的 内 存 管理 )，209- 
222 
binding model of( 基 本 的 内 存 管理 的 绑 定 模型 )， 
210-211 
purpose of (基本 的 内 存 管理 的 目的 )，209-210 
见 Memory management 
Basic rate interface (BRI， 基 本 速率 接口 )，351 
Batch files( 批 处 理 文 件 )，59 
Batch-oriented job streams (面向 批 处 理 的 作业 流 )， 
164 
Be Inc. (Be 公司 )，38，110 
Bell Laboratories (贝尔 实验 室 )，114 
BeOS (BeOS 操作 系统 )，38，110 
Berkeley Sockets (伯克利 套 接 字 )，474 
Best efforts functionality (“ 尽 力 而 为 ”功能 特性 )， 
341 
Best fit (最 佳 适应 算法 )，219 
Bi-directional attributes (双向 连接 属性 )，184，185 
Big Kernel Lock (大 内 核 锁 )，463 
Bin (程序 二 进 制 文件 )，491 
Binary semaphores (二 值 型 信和 号 量 )，193 
Binary trees (B-trees， 二 义 树 )，268 
Binding model ( 绑 定 模型 )，210-211 
Biovine spongiform encephalopathy ( BSE， 牛 海绵 
状 脑病 ， 或 称 为 疯牛病 )，144 
Bit (二 进 制 位 ， 或 称 为 比特 ， 或 简称 位 )，496 
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Bit-interleaved parity (位 交叉 奇偶 校 验 )，310 

Bitmap (位 图 )，271-272，273f，430 

Bit string (位 串 )，486 

Blackberry (黑莓 手机 )，473 

Block ( 盘 块 )，269，309 

Block devices ( 块 设 备 )，299，455，504 

Blocked state (阻塞 状态 )，27 

Blocking (阻塞 )，99 

Blocking 1/O (阻塞 式 输入 /输出 )，187 

Block interleaved distributed parity ( RAID 5， 块 
交织 分 布 式 奇偶 校 验 )，311，311f 

Blocks ( 块 )，54，500 

Block striping ( 块 数据 条 纹 划分 技术 )，310f 

Blue Gene (“ 蓝 色 基 因 ” 项 目 )，144 

Blue Matter (“ 蓝 色 物质 ”项 目 )，144 

Bluetooth (蓝牙 协议 )，74，353，446，478 

Body area networks (BANs， 身 体 区 域 网 络 ， 或 
简称 体 域 网 )，353 

Bootable partitions (引导 分 区 )，306 

Boot block (引导 块 )，307 

Booted (被 引导 )，76 

Booting (引导 )，56 

Bootstrap loader (引导 装 和 人 程序 )，16 

Border gateway protocol ( BGP， 边 界 网 关 协 议 )， 
342 

Botnet (僵尸 网 络 )，363 

Bots (僵尸 机 器 )，363 

Bottom-half organization (下 半 部 组 织 结构 )，120 

Bounded-buffer problem (有 界 缓冲 区 问题 )，195- 
196 

Bounds checking (边界 检查 )，364 

Branch operation (分 支 操作 )，487 

Bridge (网 桥 )，346-347，353，505 

Broadcast (广播 式 传送 )，184，186 

Broadcast packets (广播 式 数据 包 )，335，336 

Broadcast storms (广播 风暴 )，348 

Brute force attack ( 蛮 力 攻击 ， 或 称 为 穷 举 式 攻击 )， 
374 

BSD Secure Levels (伯克利 软件 发 行 版 安全 分 级 
系统 )，462 

BSD UNIX File System (伯克利 软件 发 行 版 UNIX 
文件 系统 )，453 

Buddy system (伙伴 系统 )，451 

Buffering (缓冲 技术 )，300，304-305，305t 
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Buffering strategy (缓冲 策略 )，184，185 
Buffer overflows (缓冲 区 溢出 )，364-365 
Buffer overrun (缓冲 区 溢出 )，364-365 
Built-in-functions (内 置 功能 )，59 
Bully algorithm( 强 者 算法 )，402，403，403f 
Burst errors( 突 发 错误 )，308 
Business rules (业务 规则 )，388 
Busy-waiting ( 忙 等 待 )，193 
Bytes ( 字 节 )，496 
C 
Cable modems (有 线 电视 网 络 调制 解 调 器 ， 或 称 
为 有 线 调制 解 调 器 或 电缆 调制 解 调 器 )，351 
Cache hits (高 速 缓存 命中 )，500 
Cache memory (高 速 缓存 存储 器 ， 或 称 为 高 速 组 
存 )，497-498 
Cache misses (高 速 缓 存 未 命中 )，500 
Caching (高 速 缓存 )，301 
Calculator (计算 器 )，92，93f 
Cameras (照相 机 ， 或 称 为 相机 )，473 
Capability list (CL， 权 限 表 )，369，369f 
Carbon API ( 碳 式 应 用 程序 接口 )，109 
Card Bus (插件 总 线 )，438 
Card deck ( loadable program tape， 卡 片 琶 /可 加 
载 程序 带 )，16f 
Cards ( 择 卡 ， 或 称 为 卡 )，51，70 
Care-of address (转交 地 址 )，396 
Carrier sense multiple access/collision detection 
(CSMA/CD， 载 波 侦 听 多 路 访问 / 冲突 检测 )， 
346 
Carnegie Mellon University ( 卡 内 基 梅 隆 大 学 )，399 
Case studies (实例 研究 ),file systems (文件 系统 )， 
284-288 
Categorization (分 类 )，503 
Category(Cat， 非 屏蔽 型 双 绞 线 布线 的 质量 类 别 )， 
3S2 
Cathode ray tube (CRT， 阴 极 射线 管 )，72 
CDFS (只 读 光盘 标准 格式 文件 系统 )，428 
Centralized lock server (集中 式 锁定 机 制服 务 器 )， 
401f 
Central processing unit(CPU， 中 央 处 理 器 / 处 理 器 ) 
components of (处 理 器 部 件 )，490-491，490f 
defined (关于 处 理 器 的 解释 )，484 
development of (处 理 器 的 开发 )，103-104 
types of (处 理 器 的 类 型 )，22-23 


CERN (欧洲 粒子 物理 研究 所 )，140 

Certificate (证 书 )，377 

Certificate authority (认证 机 构 )，377 

Cfq scheduler ( complete fair queuing scheduler, 
完全 公平 排队 调度 器 ， 或 称 为 完全 公平 排队 
调度 程序 )，321 

Change a message( 算 改 消息 )，373 

Change directory (cd 或 chdir， 改变 目录 )，264 

Change journal (关于 变更 日 志 的 特殊 文件 类 型 )， 


434 
Change logging (更 改 日 志 ， 即 把 更 改 操 作 记 录 到 
日 志 )，434 


Change mode (更 改 文件 模式 )，121 

Character devices (字符 设备 )，299，455，504 

Character recognition (字符 识别 )，73 

Checkdisk (磁盘 检查 修复 工具 例 程 )，293 

Checksumming ( 校 验 和 )，138 

Child process ( 子 进 程 )，123 ，164-165 

Chip-level multiprocessor ( CMP， 芯 片 级 多 处 理 
器 )，124 

Chmod (关于 更 改 文 件 模式 的 例 程 或 命令 )，121- 
122 

Choices (Choices 操作 系统 )，38 

CHS addressing ( 柱 面 磁 头 扇 区 寻 址 ， 或 称 为 CHS 
编 址 )，303 

Circular buffer (循环 缓冲 )，188 

Circular-LOOK(C-LOOK ， 循 环 向 前 看 调度 算法 )， 
318-319, 319f, 320f, 457 

Circular queue (循环 队列 )，188 

Circular wait (循环 等 待 )，199，202-203 

City traffic deadlock (城市 交通 中 的 死 锁 问 题 )， 
200f 

ClassAds (类 似 于 分 类 广告 一 样 的 描述 )，137 

Classic environment (传统 环境 )，110 

Classified advertisements (分 类 广告 )，137 

Classless interdomain routing ( CIDR， 无 类 别 域 
间 路 由 )，342，344 

Clean page mechanisms (页 面 清理 机 制 )，247 

Clean service shutdown (清理 服务 后 再 关机 )，420 

Client (客户 端 ， 或 称 为 客户 机 )，32 

Client server (客户 端 - 服务器， 或 称 为 客户 机 - 
服务 器 )，388，388f，504 

Client stub (客户 端 桩 例 程 )，396 

Clock (时钟 )，493 


Clock algorithm (时 钟 算法 )，242 
Clock cycle (系统 时 钟 周 期 )，493 
Clock synchronization (时 钟 同 步 )，400-401 
Clock time〈 时 钟 时 间 )，131 
Clone call flags ( clone 系统 调用 参数 所 用 到 的 标 
志 )，123t 
Clone system call (clone 系统 调用 )，176-177 
Cluster ( 簇 )，269 
Clustered multiprocessing system( 集 群 多 处 理 系统 )， 
134f 
Clusters (集群 )，134-135 
concept of (集群 的 概念 )，139-140 
defined (关于 集群 的 解释 )，129 
types of (集群 的 类 型 )，142-146 
Clusters of workstations ( COWS， 工 作 站 集群 )， 
130 
CMOS memory (互补 金属 氧化 物 半导体 存储 器 )， 
307 
Coax( 同 轴 电 缆 )，352 
Coaxial cable ( 同 轴 电 缆 )，352 
Cobalt (第 6 版 Palm 操作 系统 的 名 称 )，480 
CODA (内 容 分 发 体系 结构 )，399 
Code (编码 )，210 
Code Fragment Manager (代码 片段 管理 器 )，103 
Code integrity verification (代码 完整 性 验证 )，419 
CodeWarrior (由 Metrowerks 公司 提供 的 基于 Palm 
操作 系统 平台 的 商用 的 集成 开发 环境 )，476 
Coding time (编码 时 )，211-212 
Collision (冲突 )，346 
ColorSync (一 款 颜色 管理 实用 程序 ， 语意 色彩 同 
步 )，102 
Columbia University (哥伦比亚 大 学 )，211 
Command interpreter (命令 解释 器 )，11，60，164- 
166 | 
Command line interface (命令 行 接 口 )，60，92 
Command queuing (命令 式 排 队 )，321 
Command set (命令 集 )，503 
Commercial IP Security Option (CIPSO, Linux 安 
全 系统 名 称 ， 帘 意 商 业 网 际 协 议 安全 选项 )， 
462 
Commercial platforms (商业 平台 )，465t 
Common Internet file system ( CIFS， 通 用 互联 网 
文件 系统 )，183，386，399，461 
Common language runtime ( CLR， 通 用 语言 运行 
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库 )，39，365，393 
Common object request broker ( CORBA ， 通 用 对 
象 请 求 代理 体系 结构 )，398 
Communication (通信 )，182 
Communication circuits (通信 电路 )，473 
Communication security (通信 安全 )，373-377，374- 
376f 
Communication threats (通信 威胁 )，374f 
Compact disc (CD ， 光 盘 )，288-289，428，452 
Compact disc-read only memory ( CD-ROM， 只 读 
光盘 存储 器 )，108，308，499 
Compact disc-read write ( CD-RW， 读 写 式 光 盘 )， 
485, 499 
Compaction (紧凑)，77，220，220f 
Compaq( 康 柏 公司 )，324 
Compiler (编译 器 )，491 
Complete fair queuing (CFQ， 完 全 公平 排队 ), “458 
Complete fair queuing scheduler (cfq scheduler, 
完全 公平 排队 调度 器 ， 或 称 为 完全 公平 排队 
调度 程序 )，321 
Complex file names (复杂 文件 名 )，435 
Complex instruction set computer ( CISC， 复 杂 指 
令 集 计算 机 )，486 
Compression (压缩 )，434-435 
Computational Biology Center (计算 生物 学 中 心 )， 
144 
Computational grid (计算 网 格 )，142-143 
Computer networks (计算 机 网 络 )，331-356 
basics of (计算 机 网 络 基础 )，333-338 
physical layer of (计算 机 网 络 物理 层 )，352-354 
purpose of (计算 机 网 络 的 目的 )，332-333 
Computer system, overview and architecture con- 
cepts〈 计 算 机 系统 、 总 览 和 体系 结构 概念 )， 
483-507 
components of (计算 机 系统 组 成 部 件 )，484-485， 
485t 
concepts of (计算 机 系统 的 概念 )，507f 
illustration of (计算 机 系统 图 解 )，507，507f 
Computer viruses (计算 机 病毒 )，361 
Computing grids (计算 网 格 )，135-136 
Concurrency (并 发 )，387 
Concurrency protection (并 发 性 保护 )，372-373 
Conditional branch-on-equal operation (分 支 跳 转 
操作 )，490f 
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Condition variables (条 件 变 量 )，197 

Condor Project (威斯康星 大 学 志愿 计算 项 目 )，136， 
137 

Config.sys( 机 器 硬件 配置 文件 名 )，438 

Connectionless attributes (无 连接 的 通信 属性 )，184， 
185-186 

Connection oriented attributes (面向 连接 的 通信 属 
性 )，184，185-186，341 

Connection super-server( 监听 连接 的 超级 服务 器 )， 
461 

Console (控制 台 )，49 

Console command processor ( CCP， 控 制 台 命令 处 
理 程序 )，50，70 

Content addressable memory ( CAM， 内 容 可 寻 址 
存储 器 )，228 

Context Switch (上 下 文 切换 )，23，30，100 

Context switch overhead (上 下 文 切换 的 开销 )， 
163 

Contiguous allocation (连续 分 配 )，273-275，274f 

Controlled devices( 受 控 型 设备 )，502 

Controller (控制 器 )，321-322，491-492 

Controller cache (控制 器 高 速 缓存 ， 或 称 为 控制 
器 缓存 )，499 

Control Panel (控制 面板 )，92 

Control Program/Monitor ( CP/M， 早 期 操作 系统 
名 称 ， 寅 意 控制 程序 / 监控 者 ) 

abstraction , component of (CP/M 的 抽象 及 组 成 )， 
50 
development of (CP/M 的 开发 )，49 

Control unit (控制 器 )，491 

Convoy effect ( 结 队 效应 )，162 

Cooked interface ( 熟 式 接口 )，82 

Cookies (小 型 文本 文件 )，366 

Cooperating process (协作 式 进程 )，181，386 

Cooperative multitasking (协作 式 多 任务 )，99，157 

Coordinator (协调 器 )，402 

Copper wire Specifications ( 铜 线 规 格 )，352 

Copy command (cp/copy， 文 件 拷贝 命令 )，264 

Copy-on-write ( 写 时 复制 )，176，248，426-427 

CORBA (Common Object Request Broker Architec- 
ture， 通 用 对 象 请 求 代理 体系 结构 )，134-135 

Cornell University ( 康 奈 尔 大 学 )，362 

Counting semaphores (计数 型 信号 量 )，194 

Coupled multiprocessors (耦合 型 多 处 理 器 )，124 


CP-40 (IBM 硬件 级 虚拟 机 及 仿真 软件 包 )，38 

CPU preference ( 处理 器 偏好 )，133 

CPU process scheduler (处理 器 进程 调度 器 ， 或 称 
为 进程 调度 器 )，27 

CPU scheduler (处 理 器 调度 程序 )，27 

CPU state information (处 理 器 状态 信息 )，153 

CPU utilization (处 理 器 利用 率 )，161 

Crash protection (系统 崩溃 保护 )，371-372 

Critical region (临界 区 )，401 

Critical section (临界 区 )，138，192 

CTL/C (组 合 按键 : CTL 按键 +C 按键 )，187 

Current position ( 当前 位 置 )，265 

Current record pointer (当前 记录 指针 )，265 

Current working directory ( 当前 工作 目录 )，263 

Cursor tracking mouse motion (光标 跟踪 鼠标 移 
动 )，8-9，9f 

Cyclic elevator (循环 电梯 调度 算法 )，318-319 

Cyclic redundancy check ( CRC， 循 环 宛 余 校 验 ， 
或 称 为 循环 移 余 校 验 码 )，138，308，308t， 
349 

Cylinders( 柱 面 )，302-303 

Cylindrical-LOOK ( 圆 简 状 向 前 看 调度 算法 )，318- 
319 

D 

Database file support (数据 库 式 文件 支持 )，80-81 

Database servers (数据 库 服务 器 )，31] ，484 

Database storage (数据 库存 储 )，388 

Data cache (数据 高 速 缓 存 )，498 

Data encryption standard ( DES， 数 据 加 密 标 准 )， 
373 

Data fetch (数据 提取 )，494 

Data link layer (数据 链 路 层 )，345-350 

Data path (数据 通路 )，492 

Datapoint Corp (数据 点 公司 )，457 

Data redundancy (数据 宛 余 )，432 

Data registers (数据 寄存 器 )，492 

Data run (数据 盘 区 )，431 

Data storage area (数据 存储 区 )，56，57-58 

Data stream (数据 流 )，435 

Data striping (数据 条 纹 划 分 )，309 

Data structures (数据 结构 )，81 

Data value (数据 值 )，487 

Deadline scheduler (基于 截止 时 间 的 调度 程序 )， 
321, 458 


Deadlocks ( 死 锁 ) 
defined (关于 死 锁 的 解释 )，182 
process management and (进程 管理 与 死 锁 )，197- 
206，198-200f 
Decode (解码 )，494 
Decryption (解密 )，374 
Dedicated parity drive (奇偶 校 验 专用 磁盘 )，310- 
Ll "SL 
De facto standard (事实 上 的 标准 ， 或 称 为 事实 标 
准 )，50，335 
Default gateway (默认 网 关 )，343 
Default router (默认 路 由 )，343 
Defragmentation (碎片 整理 )，275，277，433 
Defrag utility (磁盘 碎片 整理 实用 例 程 )，294 
De jure standards (法 定 的 标准 ， 或 称 为 法 定 标准 )， 
335 
Delayed auto-start services (延迟 式 自 动 启 动 服务 )， 
420 
Del command (文件 删除 命令 )，264 
Demand paging (请 求 调 页 ， 或 称 为 请 求 分 页 )，238- 
248 
Demilitarized zone (DMZ， 隔 离 区 )，379 
Denial of service ( DoS， 拒 绝 服 务 攻击 )，142，345， 
363 
Dense wavelength division multiplexing (DWDM， 
密集 波 分 复 用 )，353 
Desk accessories (桌面 附件 )，92 
Detection (检测 )，201 
Detection deadlocks ( 死 锁 检测 )，205 
Device controller (设备 控制 器 )，10-11，503，503f 
Device driver (设备 驱动 程序 )，438-439，503 
defined (关于 设备 驱动 程序 的 解释 )，11 
OS，component of (操作 系统 组 成 部 分 )，12 
Devices (设备 )，10-11 
characteristics of (设备 的 特性 )，298-299，298t 
classes of (设备 的 分 类 )，298-299，298t，455- 
458 
types of (设备 的 类 型 )，502 
/dev table (设备 表 )，454-455 
Dictionary attack (字典 式 攻击 )，367 
Diffie-Hellman ( 迪 菲 - 赫 尔 曼 密 钥 交换 协议 )， 
375, 378 
Digital Equipment Corporation ( DEC， 数 字 设 备 
公司 )，92 
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Alpha (阿尔 法 处 理 咒 )，64，418 
Net (数字 设备 公司 分 层 网 络 体系 结构 协议 )， 
184, 345, 440, 456 
PDP-11 (数字 设备 公司 开发 的 一 款 复 杂 指 令 集 
计算 机 处 理 器 )，486 
VAX (数字 设备 公司 开发 的 一 款 复杂 指令 集 计 
算 机 处 理 器 )，232，486 
Digital Research ，Inc. (数字 研究 公司 )，49 
Digital rights management(DRM， 数 字 版 权 管理 )， 
362 
Digital subscriber lines (DSL， 数 字 用 户 线路 )，351 
Digital video disk (DVD， 数 字 化 视频 光盘 )，428， 
452, 499 
“ Dining Philosophers ”problem (“ 哲 学 家 就 餐 ” 
问题 )，199f 
Dir command (一 条 关于 列 出 目录 下 文件 的 命令 
dir), 264 
Directed acyclic graphs (DAGs， 有 向 无 环 图 )，261 
Directed edges (有 向 边 )，26 
Direct memory access (DMA， 内 存 直 接 存 取 技 术 )， 
322-325 
characteristics of (内 存 直 接 存 取 技术 的 特点 )， 
323 
components of (内 存 直 接 存 取 技 术 的 组 成 )，491 
future of (内 存 直 接 存 取 技术 展望 )，324-325 
Directory (目录 )，259-264 
Directory access protocol ( DAP， 目录 访问 协议 )， 
395 
Directory records (目录 记录 )，286 
Directory service (目录 服务 )，10, 395 
Dirty pages( 脏 页 ， 或 称 为 脏 页 面 )，242-243 
Discovery services (发 现 服务 )，395 
Discrete modeling (离散 建 模 )，161 
Disk boot area (磁盘 引导 区 )，55，56 
Disk cache (磁盘 高 速 缓存 ， 或 称 为 磁盘 缓存 )， 
499 
Disk class (磁盘 类 )，439 
Disk controller (磁盘 控制 器 )，55 
Disk drive (磁盘 驱动 器 )，55 
Disk format (磁盘 格式 )，51，55 
Disk head (磁头 )，55 
Disk management (磁盘 管理 )，54-55，54f 
Disk scheduling，LIO management and (磁盘 调度 ， 
输入 /输出 管理 )，297-325 
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characteristics of (设备 特性 )，298-299 
technology of (输入 /输出 技术 )，299-302 
Disk scheduling algorithms (磁盘 调度 算法 )，322 
Disk system (磁盘 系统 )，54-55，54f 
Dispatch (调度 )，155 
Dispatcher thread (调度 线程 )，392 
Displacement (d， 偏 移 地 址 )，226，234，487 
Display management (显示 管理 )，83-84，84t 
Distributed Component Object Model (DCOM, 分 
布 式 组 件 对 象 模型 )，134，135 
Distributed computing environment ( DCE， 分 布 式 
计算 环境 )，398 
Distributed Computing Environment/Remote 
Procedure Calls ( DCE/RPC， 分 布 式 计算 环 
境 /远程 过 程 调用 )，461 
Distributed file system ( DFS， 分 布 式 文件 系统 )， 
399-400 
Distributed OS (分 布 式 操作 系统 )，385-409 
defined (关于 分 布 式 操作 系统 的 解释 )，32 
development of (分 布 式 操作 系统 的 开发 )，386- 
388，387f 
models of (分 布 式 操作 系统 的 模型 )，396-400， 
397f 
Distributed processing (分 布 式 处 理 )，127-147 
architectures of (分 布 式 处 理 体系 结构 )，133f， 
134-138,134f 
concepts of (分 布 式 处 理 的 概念 )，128 
Distributed system architecture (分 布 式 系统 体系 
结构 )，132-134，133f 
Distributed transactions (分 布 式 事务 )，405-406 
Distribution (发 行 版 本 )，116 
Distribution transparency (分 布 透 明 性 )，387 
Distributive objects (分 布 式 对 象 )，398 
DLL Hell (动态 链接 库 地 狱 )，222 
DMA controller (内 存 直 接 存 取 型 控制 器 )，298， 
322-323，491 
Domain( 域 )，343 
Domain name servers( DNS， 域 名 服务 器 )，343， 
505 
Domain name system (DNS， 域名 系统 )，394-395 
Dotted decimal notation (点 分 十 进 制 标 记 )，342 
Double buffering ( 双 缓 冲 技术 )，300，301f 
Drive rotation speed (驱动 器 旋转 速度 )，305t 
Dual memory access (两 次 访问 内 存 )，228，228f 


Duplexing (磁盘 双 工 )，310 

Dynamically loadable modules ( DLMs， 动 态 可 加 
载 模块 )，117-119，118f，119%t 

Dynamic bad-cluster handling (动态 坏 艇 处理)，435 

Dynamic host configuration protocol ( DHCP， 动 
态 主机 配置 协议 )，343 

Dynamic link libraries ( DLLs， 动态 链接 库 )，221- 
222 

Dynamic load balancing (动态 负载 均衡 )，32 

Dynamic loading (动态 加 载 )，221 

Dynamic memory (动态 内 存 )，6 

Dynamic priority (动态 优先 级 )，423-424 

Dynamic random access memory ( DRAM， 动 态 随 
机 存 取 存储 器 )，76，497 

Dynamic relocation (动态 重 定位 )，213 

E 

Effective access time ( EAT， 有 效 访问 时 间 )，229- 
230 

Effective address time (EAT， 有 效 寻 址 时 间 )，239- 
240，240t 

802.11 (无 线 局 域 网 物理 协议 )，457 

800 TFLOPS (每 秒 800 万 亿 次 浮 点 运算 操作 )， 
13% 

80/20 rule( 80/20 法 则 )，239 

EISA buses (扩展 版 企业 标准 架构 总 线 )，438 

Election (选举 )，402-404，403f，404f 

Electronic main memory (电子 主 内 存 )，70 

Elevator algorithm (电梯 调度 算法 )，317-318 

E-mail (电子 邮件 )，399 

Embedded computer systems( 从 人 式 计 算 机 系统 )， 
484 

Emulator (Palm 仿真 器 软件 包 )，476 

Enabled application (志愿 式 启用 型 应 用 程序 )， 
183-184，386 

Encrypting file system (EFS， 加 密 文件 系统 )，433 

Encryption (加密 )，374-376，374-376f，433-434 

End users (终端 用 户 )，6，7?7f 

End users view (终端 用 户 视 图 )，9 

Enhanced interior gateway routing protocol (EIGRP, 
增强 型 内 部 网 关 路 由 协议 )，342 

Enhanced second chance algorithm (增强 型 二 次 机 
会 算法 )，244 

Entry section (进入 区 )，192 

Environment (操作 系统 环境 )，121-122，123f， 


394，422 

EPOC ( EPOC 操作 系统 ,寓意 个 人 便利 设备 的 新 
纪元 )，68，476 

Equal allocation (公平 分 配 ， 或 称 为 平均 分 配 )，245 

Error correction codes ( ECC ， 错 误 校 验 码 )，307- 
310 

Error detection codes (EDC， 差 错 检测 码 )，307-308， 
308t 

Ethernet™ (以 太 网 )，346 

ETRAX CRIS ( 安 讯 士 公司 Axis Communications 
开发 的 一 款 处 理 器 )，446 

Event-driven programs (面向 事件 驱动 的 程序 )，84- 
85, 85f 

Event loop (事件 循环 )，74 

Exactly once semantics (恰好 一 次 性 的 语义 )，408 

Exchange libraries (交换 库 )，474 

Exchange Manager (交换 管理 器 )，474 

Exec system call (exec 系统 调用 )，166 

Executable code (可 执行 代码 )，61，491 

Executable programs (可 执行 程序 )，491 

Execution，defined (关于 执行 过 程 的 解释 )，20 

Execution modes (执行 模式 )，28-29，490 

Exit section (退出 区 )，192 

Exit state (终止 状态 )，155 

Expired runqueue (失效 运行 队列 ， 或 称 为 过 期 运 
行 队列 )，448 

Exponentially decaying ( 按 指数 方式 衰减 )，158 

Ext2f (Linux 第 二 代 扩 展 文件 系统 )，452 

Ext3 (Linux 第 三 代 扩 展 文件 系统 )，295 

Extent (扩展 盘 块 区 )，274，429 

Extent counter (延长 计数 )，57 

External attributes (外 部 属性 )，429-430 

EXternal Data Representation ( XDR， 外 部 数据 表 
示 )，397 

External fragmentation (外 部 碎片 化 )，76，77f，219， 
2753 

F 

Failure，handling (故障 ， 处 理 )，142 

Fair-share scheduling (公平 分 配 调度 )，158 

Family x86 memory map (关于 x86 体系 机 构 的 内 
存 映射 )，425f 

Fast Ethernet (快速 以 太 网 )，348 

Fast user switching (快速 用 户 切 换 )，415 

Fat binaries( 胖 二 进 制 代码 )，103 
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FAT file systems (FAT 文件 系统 )，285f，285t 
Fault tolerance (容错 性 ， 或 称 为 容错 能 力 )，406- 
409，407f，408f，432 
FDDI (Fiber Distributed Data Interface， 光 纤 分 布 
式 数据 接口 )，457 
FDISK (DOS 系统 磁盘 分 区 管理 实用 程序 )，306 
Feedback (反馈 )，160 
Fetch-and-add ( 取 - 加 操作 )，193 
Fiber distributed data interface (FDDI， 光 纤 分 布 
式 数 据 接口 )，346，457 
Fiber optic specifications (光纤 规格 )，352-353 
Fiber to the Curb (FTTC， 光 纤 人 户 )，351 
Fields (字段 )，486 
File abstraction (文件 抽象 )，265 
File allocation table (FAT， 文 件 分 配 表 ) 
defined (关于 文件 分 配 表 的 解释 )，284 
16 (FAT16 文件 系统 )，284，428 
structure of (文件 分 配 表 结构 )，272 
32 (FAT32 文件 系统 )，284，428 
12 (FAT12 文件 系统 )，284，290，305，428 
File buffering (文件 缓冲 )，10 
File control blocks (文件 控制 块 )，122，123f 
File copying (文件 复制 )，10f 
File directory area (文件 目录 区 )，55，56-57 
File encryption (文件 加 密 )，108 
File management (文件 管理 )，22 
File metadata (文件 元 数据 )，259，264 
File mode (文件 模式 )，122 
File name (文件 名 )，56-57，430 
File open dialog box (“文件 打开 ”对 话 框 )，440f 
File permissions (文件 访问 权限 ， 或 称 为 文件 操 
作 权 限 )，121-122 
File protection (文件 保护 )，373 
File record (文件 记录 )，284 
File redirector (文件 重 定向 器 )，453 
File servers (文件 服务 器 )，31，484 
File sharing techniques (文件 共享 技术 )，141 
File storage (文件 存储 )，10，278f 
File support (文件 支持 )，80-81，452-454，472 
File system (文件 系统 ) 
basic (文件 系统 基础 )，257-280 
multiple (多 文件 系统 )，290-292，291f，292f 
purpose of (文件 系统 的 目的 )，258，258f，283 
types of (文件 系统 类 型 )，283-295 
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File transfer protocol ( FTP， 文 件 传输 协议 )，32， 
114，340，344，415 

File type (文件 类 型 )，56-57 

Filters (过 滤器 )，437 

Finder (查找 器 应 用 程序 )，92，96，98 

Firewall (防火 墙 )， 345，379，379f 

FireWire (火线 )，106，502 

Firmware (固件 )，55，496 

First come ，first served ( FCFS ， 先 来 先 服务 调度 
算法 )，156-157，315，315f 

First fit (首次 适应 算法 )，219 

First in，first out (FIFO， 先 进 先 出 淘汰 算法 )，37， 
241, 315, 31$Sf, 449 

Five-state process model (五 状态 进程 模型 )，154f 

Fixed data (固定 的 数据 )，61 

Fixed memory (固定 存储 器 )，6 

Fixed number of processes (固定 进程 数 )，216- 
218, 217f, S18f 

Fixed load address (固定 的 加 载 地 址 )，59 

Flash memory (闪存 )，71 

Flat process group (平坦 型 进程 组 )，407，408f 

Floating point unit ( 浮 点 部 件 )，490 

Floppy disk (软盘 )，54f，371 

FlProtect (利用 Win32 库 函 数 创建 内 存 映射 对 象 
时 关于 访问 控制 及 保护 设置 的 参数 )，250 

Folder records (文件 夹 记录 )，286 

Folders (文件 夹 )，93 ，259 

Folding@home (“蛋白质 折合 之 家 ” )，144 

Foreground process (前 台 进 程 )，63 

Fork( 用 于 创建 进程 的 fork 访 管 调用 或 系统 调用 )， 
164-165, 427 

“Forking a child” (创建 一 个 子 进程 )，165 

Fork system call( 用 于 创建 进程 的 fork 系统 调用 )， 
176 

Forms( 窗 体 )，83 

Forth (Forth 程序 设计 语言 )，476 

Fortran compiler ( Fortran 程序 设计 语言 编译 器 )， 
173 

Frac-T (fractional T1， 次 Tl 线路 )，350 

Fragmented file (碎片 化 文件 )，277 

Frame (f， 页 框 ， 或 称 为 物理 块 ， 有 时 也 称 为 内 
存 页 面 ， 甚 至 简单 地 称 为 页 面 )，226，227 

Frame relay ( 帧 中 继 )，350，350-351，457 

FreeBSD (由 加 州 大 学 伯克利 分 校 开发 的 UNIX 


版 衍生 形成 的 免费 开源 的 操作 系统 )，110 
Free Software Foundation ( 自由 软件 基金 会 )，115 
Free space (空闲 空间 )，269-270 
Free space chain (空闲 空间 链 )，270f 
Free space tracking (空闲 空间 监测 )，79-80，269- 

272，270-273f 
F-SCAN ( 先 来 先 服务 - 向 前 看 调度 算法 )，320 
Fsck (类 UNIX 系统 中 磁盘 及 文件 系统 检查 修复 

工具 实用 例 程 )，294，299 
Full duplex (全 双 工 模式 )，335 
Fully connected mesh (完全 互联 的 网 状 网 络 拓扑 
结构 )，337f 
Fully qualified name (完全 限定 式 名 称 )，343 
Functional classes of OS (面向 功能 的 操作 系统 分 

类 )，29-33 
Functionality (功能 )，5-6，40-41 
Function migration (功能 迁移 )，349-350 
Function name (*fn) ( 传 给 系统 调用 的 函数 名 参数 )， 

176 
Functions of OS (操作 系统 的 功能 )，20-22 

G 
Gadgets (小 工具 )，83 
Garbage collection (碎片 收集 )，79f 
Garnet ( 5.4 版 起 Palm 操作 系统 的 应 用 程序 接口 

名 称 )，480 
General-purpose registers (通用 寄存 器 )，492 
Genome shotgun assembly approach (基因 组 乌 枪 

组 装 法 )，143 
Gigabit Ethernet〈 千 兆 以 太 网 )，347 
Gigabytes (GB， 笼 统计 为 10 亿 字 节 ， 即 千 兆 字 节 )， 

497 
Gigahertz (GHz，10 亿 赫兹 ， 即 千 兆赫 兹 )，128 
GigAssembler (公共 人 类 基因 组 计划 集群 计算 程 

序 )，143 
GIMPS (梅森 素数 大 搜索 项 目 计算 程序 )，175 
Global positioning system ( GPS ， 全 球 定位 系统 )， 

70 
Global replacement (全 局 置换 )，244 
Globus cluster ( 格 洛 伯 斯 集群 )，145-146 
Globus Toolkit ( 格 洛 伯 斯 工具 包 )，135 
GNU Network Object Model Environment ( GNOME， 

GNU 网 络 对 象 模型 环境 )，115，459 
Google (谷歌 )，182，389-391，390f 
GOSSIP (一 种 协议 )，334 


Graffiti input (涂鸦 式 输入 )，70 
Graphical user interface ( GUI， 图 形 化 用 户 界面 ， 
或 称 为 图 形 化 用 户 接口 )，91-92，96-97，102 
elements of (图 形 化 用 户 界面 构成 要 素 )，83 ，84 
interface of (图 形 化 用 户 界面 接口 )，418 
MultiFinder (多 重 查找 器 )，100 
Graph workflows (工作 流 图 )，130f 
Green threads (绿色 线程 )，170 
Grid (网 格 )，129-130，140-141 
Grid computing (网 格 计算 )，175 
Grouped free space chain (基于 分 组 的 空闲 空间 链 )， 
272f 
Grouping (分 组 )，271 
Groups (分 组 )，369-370 
Guaranteed scheduling (保证 型 调度 )，157-158 
Guard area (警戒 区 )，425 
Guest OS (客户 机 操作 系统 )，38，392 
GUI (图 形 化 用 户 界 面 ， 或 称 为 图 形 化 用 户 接口 ) 
见 Graphical user interface (GUI) 
H 
Hacker release (“ 黑 客 ” 版 本 ， 即 开发 版 本 )，116 
Hackers (黑客 )，360 
Hamming( 海 明码 )，308 
Handspring ( 腾 跃 公司 )，69 
Hard deadlines【〈 硬 性 的 截止 时 间 )，32 
Hard disk (硬盘 )，302f，498 
Hardware (硬件 )，82-83 
Hardware abstraction layer (HAL， 硬 件 抽象 层 )， 
72-73, 421 
Hardware changes (硬件 变化 )，106 
Hardware components (硬件 组 成 )，51f 
Hardware details ，hiding (硬件 细节 ， 隐 藏 )，82 
Hardware events (硬件 事件 )，495 
Hardware locking instructions (硬件 锁 指 令 )，192- 
193 
Hardware system dependent (硬件 系统 相关 )，163 
Hardware virtual machines (硬件 级 虚拟 机 )，38- 
39 
Hash ( 散 列 函数 ， 也 称 为 哈 希 函数 )，376-377 
Hashed access( 散 列 存 取 ， 或 称 为 散 列 访问 )，268 
“Have the focus”(“ 持 有 和 焦点”)，97 
Header (数据 库 首部 ; 报头 )，80，334 
“Head of line blocking”(“ 队 首 阻 塞 ”)，162 
Heads( 读 写 磁头 )，302-303 
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Heap ( 堆 ), 61, 76 

H8/300 (日 立 Hitachi 公司 的 H8/300 系列 处 理 器 )， 
446 

Heterogeneity ( 异 构 性 )，185，187，387 

Hewlett-Packard (惠普 公司 )，446 

HFile (创建 内 存 映 射 对 象 时 的 一 个 参数 ， 即 指向 
用 来 创建 该 对 象 的 文件 的 句柄 )，250 

Hierarchical File System ( HFS， 多 级 文件 系统 ,或 
称 为 分 层 式 文 件 系统 )，98 

Hierarchical File System Plus ( HFS+， 多 级 文件 
系统 升级 版 )，105-106 

Hierarchical group (分 层 式 进程 组 )，407 

Hierarchical process group (分 层 式 进程 组 )，407f 

Hierarchical tree(〈 树 形 网 络 拓扑 结构 )，336f 

Higher-level access methods (更 高 级 别 的 存 取 方 
法 )，267-268，267f 

Higher-level services (高 级 服务 )，31-32 

Higher-level system view (高 级 系统 视图 )，8 

Highest response ratio next (HRRN， 高 响应 比 优 
先 调度 )，159 

High performance file system ( HPFS， 高 性 能 文件 
系统 )，428 

Hitachi (日 立 公司 )，446 

Hit ratio (命中 率 )，229 

Hold-and-wait ( 持 有 - 等 待 条 件 )，198，202 

Hole ( 空 穴 )，219 

Home address( 主 地 址 )，396 

Homogeneous( 同 构 通信 )，185，187 

Honeywell (和 霍 尼 韦 尔 公司 )，31 

Horizontal distribution (水 平分 布 )，390，390-391 

Host OS (主机 操作 系统 )，38，392 

Hot standby( 热 备份 )，314 

Hub (集线器 )，346 

Human Genome Project (人 类 基因 组 计划 )，143 

Hybrid hard drives (HHD， 混 合式 硬盘 )，325，420- 
421 

Hyperlinks ( 超 链接 )，398 

Hypertext Transport Protocol (HTTP， 超 文本 传输 
协议 )，114，339-340，378 

Hyper-Threading ( 超 线程 )，172，446 

l 
IBM (美国 国际 商用 机 器 公司 ) 
Computational Biology Center ( IBM 计算 生物 学 

中 心 )，144 
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CP/M，use of (IBM CP/M 操作 系统 ， 使 用 )，50 
emulation packages produced by (IBM 开发 的 仿 
真 软件 包 )，38 
MicroChannel (IBM 微 通道 总 线 )，438 
networking (IBM 网 络 协议 )，440 
PC (IBM 个 人 计算 机 )，91，104 
RS6000 (IBM RS6000 处 理 器 架构 )，103 
650 (IBM 650 计算 机 系统 )，211 
360 (IBM 360 计算 机 系统 )，275 
Idempotent ( 笑 等 的 )，407 
Identifier (ID ， 用 户 标识 符 )，121 
Ident service (认证 服务 )，463 
Idle process (空闲 进程 )，157 
Idle thread (空闲 线程 )，424 
IEEE (电气 电子 工程 师 协 会 ) 
Committee (电气 电子 工程 师 协会 委员 会 )，115 
802 (IEEE-802 网 络 )，308 
1003 (IEEE 1003 可 移植 操作 系统 接口 标准 )， 
422 
1394 (IEEE 1394 串 行 接口 标准 )，438 
iLink (索尼 公司 的 爱 点 连接 串 行 接口 )，502 
i-list〈 索 引 结 点 列表 ， 或 称 为 索引 结 点 集 )，286- 
287 
Immediate addressing (立即 寻 址 )，487 
Improved linked list (改进 的 链表 法 )，270-271， 
271f, 27 
Inconsistent state (不 一 致 的 状态 )，405 
Incremental releases ( 增 量 版 本 )，96 
Independent data disks with double parity (独立 的 
双 奇 偶 校 验 数据 磁盘 )，311-312 
Independent process (独立 型 进程 )，181 
Index block (索引 盘 块 )，270 
Indexed access (索引 存 取 )，267-268，267f 
Indexed allocation (索引 分 配 )，278-279，278-280f 
Indexed free space chain (基于 索引 机 制 的 空闲 空 
间 链 )，271f 
Indexed sequential access method (ISAM， 索引 顺 
序 存 取 方法 )，267 
Index hole (指示 孔 )，54 
Indexing (索引 )，435 
Index register (索引 寄存 器 )，487，492 
Index root (索引 根 )，430 
Indirect addressing (间接 寻 址 )，487 
Inetd server (Linux 操作 系统 用 于 监听 连接 的 超级 


服务 器 )，461 
Infiniband (无 限 带宽 )，446 
Init phase (程序 的 初始 化 阶段 )，215 
Inode (索引 结 点 )，259，286，287t 
Input/output (IO， 输 入 /输出 ) 
classes of (输入 /输出 设备 分 类 )，484-485 
computer systems，overview of (计算 机 系统 ， 输 
入 /输出 概述 )，502-504 
Linux，use of ( Linux 系统 ， 输 入 /输出 使 用 )， 
454-458 
management of (输入 /输出 管理 )，297-325 
Palm OS，subsystems of ( Palm 操作 系统 ， 输 
人 /输出 子 系统 )，472-473 
single process OS，management of ( 单 进程 操作 
系统 ， 输 入 /输出 管理 )，52-54 
single-user multitasking OS ，basic ( 单 用 户 多 任 
务 操作 系统 ， 基 本 输入 /输出 )，82 
Windows NT，use of (Windows NT 系统 ， 输入/ 
输出 使 用 )，436-439 
Instant messaging (IM， 即 时 通信 )，333，373，479 
Instruction address (指令 地 址 )，487 
Instruction cache (指令 高 速 缓存 )，498 
Instruction counter (指令 计数 器 )，167f，492 
Instruction execution cycle (指令 执行 周期 )，493- 
494 
Instruction fetch (指令 提取 )，493 
Instruction formats (指令 格式 )，488f 
Instruction pointer (指令 指针 )，166 
Instruction register (指令 寄存 器 )，152，492 
Instruction set (指令 集 )，485，486-490 
Integrated circuits (ICs， 集 成 电路 )，51 
Integrated development environments (IDEs， 集 成 
开发 环境 )，476 
Integrated services for digital networks (ISDN， 综 
合 业务 数字 网 络 )，351 
Intel (英特尔 ) 
CPU (英特尔 处 理 器 )，417 
8080 (英特尔 8080 处 理 器 )，50 
8088 (英特尔 8088 处 理 器 )，50 
8080/8085 (英特尔 8080/8085 处 理 器 )，49 
80X 86 (英特尔 80 X 86 处 理 器 )，187 
i860 (英特尔 i860 处 理 器 )，418 
Itanium 64 (英特尔 安 腾 64 位 处 理 器 )，418 
PC (英特尔 处 理 器 个 人 计算 机 )，103 


Pentium (英特尔 奔腾 处 理 器 )，233 
386 (英特尔 386 处 理 器 )，115，116 
x86 (英特尔 x86 处 理 器 )，418，486 
Interactive mail access protocol (IMAP， 交 互 式 邮 
件 访问 协议 )，340-341，344 
Interactiveness (交互 性 )，449，464 
Interactive processing (交互 式 处 理 )，164 
Intercept message (截获 消息 )，373 
Interface description language ( IDL， 接 口 描述 语 
言 )，397-398 
Interface Manager (IM， 界 面 管理 器 )，416 
Interior gateway routing protocol ( IGRP， 内 部 网 
关 路 由 协议 )，342 
Internal fragmentation (内 部 碎片 )，217-218，218f， 
278 
International Standards Organization ( ISO， 国际 标 
准 化 组 织 )，334，335，395 
9660 (光盘 格式 国际 标准 ISO-9660 )，288 
9945-1 (可 移植 操作 系统 接口 标准 ISO 9945- 
1 )，422 
13346 (面向 可 控 写 的 光盘 和 数字 化 视频 光盘 的 
ISO 13346 标准 格式 文件 系统 )，428 
Internet (互联 网 )，107，333，399 
Internet applications (互联 网 应 用 程序 )，474 
Internet browser (互联 网 浏览 器 )，4 
Internet control message protocol ( ICMP ， 互 联网 
控制 消息 协议 )，354 
Internet Engineering Task Force (IETF， 互 联网 工 
程 任务 组 )，335，339 
Internet Mail Consortium (互联 网 邮件 协会 )，474 
Internet naming authority(INA， 互 联网 命名 机 构 )， 
394-395 
Internet Security Association and Key Management 
Protocol/Oakley (ISA KMP/Oakley， 互 联网 
安全 联盟 和 密 钥 管理 协议 )，378 
Internet 2 (第 二 代 互 联网 )，344 
Internet Worm (互联 网 蠕虫 )，362，363 
Interprocess communication (进程 间 通 信 )，133， 
184-190 
Interrupt (中 断 )，8，35，494，495 
Interrupt disable〈 中 断 禁 用 )，495 
Interrupt handlers (中断 处 理 程 序 )，119-120 
Interrupt handling (中 断 处 理 )，35-36，35f，52 
Interrupt mask (中断 屏蔽 )，495 
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Interrupt registers〈( 中 断 寄存 器 )，492，494 

Interrupt request level (IRQ ， 中 断 请 求 级 )，438 

Interrupt vectors (中 断 向 量 )，35-36，35f 

Interthread communication (线程 间 通 信 )，167 

Intrusion detection systems ( IDSs， 人 和 人 侵 检 测 系统 )， 
379 

Intrusion prevention systems(IPSs， 和 人 入侵 防御 系统 )， 
379 

I-number (索引 结 点 编号 )，286 

Inverted page table( 反 置 页 表 )，232-233 ，232f 

IO (输入 /输出 ) 见 Input/output (IO) 

Ioctl system call (用 来 实现 硬件 输入 /输出 控制 的 
ioctl 系统 调用 )，299 

IP address (网 际 协议 地 址 ， 或 称 为 IP 地 址 )，342 

IPC systems (进程 间 通 信 系 统 )，188-189 

IP foreign agent (网 际 协 议 外 部 代理 )，396 

IP home agent (网 际 协议 主 代理 )，396 

IP routing (网 际 协 议 路 由 ， 或 称 为 IP 路 由 )，342- 
343 

IP security protocol (网 际 协议 安全 协议 ,或 称 为 
IP 安全 协议 )，378 

IP version 6 (第 6 版 网 际 协议 )，344，456 

IPX/SPX (互联 网 数据 包 交 换 协议 /序列 数据 包 交 
换 协 议 )，341，345，440，456 

IDA (红外 开发 商 协会 )，474 

IrOBEX (红外 对 象 交换 协议 )，474 

ISA Plug-and-Play (企业 标准 架构 即 插 即 用 )，446 

ISDN ( Integrated Services Digital Network， 综 合 
业务 数字 网 络 )，457 

ISDN BRI (综合 业务 数字 网 络 基本 速率 接口 服务 )， 
351 

ISS (一 款 端 口 扫描 软件 )，462 

ITU-T (国际 电信 联盟 电信 标准 局 )，395 

J 
Java (Java 程序 设计 语言 )，177 
RMI (远程 方法 调用 )，134 
Script (JavaScript 脚本 语言 )，365 

Java virtual machine (JVM，Java 虚拟 机 )，39，365 ， 
393 

JFS (日 志 式 文件 系统 )，295 

Jini (一 种 用 于 动态 创建 分 布 式 系统 并 完成 发 现 服 
务 的 中 间 件 设计 )，395 

JNode (用 Java 语言 编写 的 操作 系统 )，38 

Job (作业 )，26，151 
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Job Control Language (JCL， 作 业 控 制 语言 )，26 

Jobs，Steven ( 史 带 夫 … 乔 布 斯， 苹果 电脑 公司 创 
始 人 之 一 )，90 

Journaling file system (日 志 式 文件 系统 )，295，432 

Jump operation ( 跳 转 操作 )，487 

Junctions (联结 点 )，435 

Just-in-time (JIT， 即 时 编译 )，40，394 

K 

KADAK Products Limited (柯达 产品 有 限 公 司 )， 
69n 

Keep-alive notices (“ 连 接 保持 ”的 通知 )，403 

Kerberos (一 种 身份 认证 协议 )，373 ，462 

Kernel (内 核 )，11 

Kernel approach (内 核 方法 )，33 

Kernel architecture (内 核 体系 结构 )，446-447，447f 

Kernel-level thread ( 内核 级 线程 )，169 

Kernel mode (内 核 模式 )，29 

Keyboard (键盘 )，52-53，72-73 

Keyboard interface chip (键盘 接口 芯片 )，53 

Keychain Access (密码 链 访 问 )，108 

Keys ( 密 钥 )，374 

Kildall，Gary (加 里 ， 基 尔 代 尔 ， 个 人 计算 机 操 
作 系 统 CP/M 的 设计 者 )，49 

Kilobytes (KB ，1024 字 节 ， 笼 统计 为 千 字 节 )，498 

Kool Desktop Environment(KDE ,Kool 桌面 环境 )， 
459 

Ksym (内 核 符 号 表 )，119 

上 

Lamport timestamps ( 兰 伯 特 时 间 戳 )，400 

LAN Manager for Windows legacy system (传统 
Windows 操作 系统 所 采用 的 局 域 网 管理 器 协 
议 )，440 

Large Hadron Collider (LHC， 大 型 强 子 对 撞 机 )， 
140 

Large network operation centers (NOCs， 大 型 的 
网 络 运营 中 心 )，354 

Large page tables (大 页 表 )，231-232，231f 

LaserWriter (苹果 公司 激光 打印 机 品牌 名 )，98 

Last mile (“最 后 一 英里 ”)，350 

LAT (本 地 传输 协议 )、345 

Lawrence Livermore Labs (劳伦斯 利 弗 莫 尔 实验 
室 )，144 

Layered architecture (层次 式 体系 结构 ， 或 称 为 分 
层 式 体系 结构 )，25，33 


Layered OS approach (分 层 式 操作 系统 方法 )，33- 
34,34f 
Layered view of OS (操作 系统 的 分 层 视图 )，13f 
Layer three Switches (第 三 层 交 换 机 )，347 
Layer two switches (第 二 层 交 换 机 )，347 
Lazy loading (延迟 加 载 )，238 
L1 cache ( 1 级 高 速 缓存 ,或 称 为 Ll 高 速 缓存 )， 
498 
L2 cache (2 级 高 速 缓存 ， 或 称 为 L2 高 速 缓存 )， 
498 
L3 cache ( 3 级 高 速 缓存 ， 或 称 为 L3 高 速 缓存 )， 
498 
LDAP-to-DAP gateway (从 轻 量 级 目录 访问 协议 
到 目录 访问 协议 的 网 关 )，395 
Learning bridge (学 习 型 网 桥 )，347 
Leased line (专用 线路 ， 又 称 为 租用 线路 )，348 
Least recently used (LRU， 最 近 最 久未 使 用 页 面 
淘汰 算法 )，241 
Legacy applications (传统 应 用 程序 )，421-422 
Legacy systems (传统 系统 )，440 
Lightweight directory access protocol (LDAP， 轻 
量 级 目录 访问 协议 )，395，462 
Light-weight process (LWP， 轻 量 级 进程 )，167， 
176 
Limit register (界限 寄存 器 )，501 
Linear addressing (线性 寻 址 )，237f 
Linear bus (总 线 型 网 络 拓扑 结构 )，337f 
Linear topology (线形 网 络 拓扑 结构 )，336f 
Link tracking (链接 跟踪 )，434 
Linked allocation (链接 分 配 )，275-278，276f，277 
Linked index block lists (索引 盘 块 链表 )，279 
Linked indexed file〈 基 于 索引 盘 块 链表 的 文件 )， 
280f 
Linked list (链表 法 )，269-270，270f 
Linking (链接 )，210 
Linking time (链接 时 )，212 
Link state( 链 路 状态 )，342 
Linux (Linux 操作 系统 )，445-466 
device classes of (Linux 系统 设备 分 类 )，298t 
file system .of ( Linux 操作 系统 之 文件 系统 )，286- 
288 
historical overview of (Linux 操作 系统 发 展 简 史 )， 
446 
organization of ( Linux 操作 系统 的 基本 结构 )， 


116-117, 117f 
2.2 (Linux 内 核 2.2 版 )，451 
2.6 (Linux 内 核 2.6 版 )，447，451 
variants of (Linux 操作 系统 变种 )，463-464. 465t 
Linux Assigned Names And Numbers Authority 
(LANANA，Linux 名 称 和 编号 分 配 机 构 )， 
455 
Linux Intrusion Detection System (Linux 人 侵 检测 
系统 )，462 
Linux security module (LSM，Linux 安全 模块 )， 
462 
Liquid crystal display (LCD ， 液 晶 显 示 器 )，69 
“Little endian/big endian ”problem (“ 小 端 字 节 序 / 
大 端 字 节 序 ” 问 题 )，187 
Load (加 载 )，210 
Loadable program tape ( card deck， 可 加 载 程序 带 / 
卡片 难 )，16f 
Loader ( 装 人 程序 ， 或 称 为 加 载 程序 )，16，61 
Load operation (加 载 操 作 )，489f 
Local area network( LAN， 局 域 网 )，335-336，338f， 
506 
Local file system (本 地 文件 系统 )，288-289 
Locality of reference (引用 的 局 部 性 )，238 
Locality principle (局 部 性 原理 )，500 
Localization (本 地 化 )，10% 
Local replacement (局 部 置换 )，244，427 
Local Security Authority (LSA， 本 地 安全 授权 机 
构 )，461-462 
LocalTalk (本 地 对 话 协议 )，98 
Location (位 置 )，387 
Location aware applications (位 置 感知 类 应 用 程 
序 )，479-480 
Location transparency (位 置 透明 性 )，32 
Lock a page (锁定 一 个 页 面 )，246 
Locks ( 锁 )，192，192f 
Lock server (锁定 机 制服 务 器 )，401 
Log-based file system (基于 日 志 的 文件 系统 ， 即 
日 志 式 文件 系统 )，294-295，432 
Logical address (逻辑 地 址 )，214f 
Logical block address ( LBA ， 逻 辑 块 地 址 )，、102， 
214，303-304 
Logical clocks (逻辑 时 钟 )，400 
Logical disk organization (磁盘 逻辑 组 织 )，305- 
308 


Logical structure (逻辑 结构 )，259-262，259t，260f， 
262f 
Log-structured file system (日 志 式 文件 系统 )，295 
Longitudinal redundancy check (LRC，、 纵 向 元 余 
校 验 码 ， 或 称 为 纵向 元 余 校 验 )，308 
Long-term scheduler (长 程 调度 器 )，164 
LOOK (向 前 看 调度 算法 )，317-318，318f 
Look-and-feel (外 观 和 感觉 )，459 
Lotus Notes (企业 级 通信 协同 工作 平台 )，399 
Low-level formatting (低级 格式 化 )，104，304 
Low-level network access services (低级 的 网 络 访 
问 服务 )，31 
Low-level system view (低级 系统 视图 )，8 
LpName (创建 内 存 映射 对 象 时 的 一 个 参数 ， 用 来 
指定 欲 映 射 的 文件 的 名 称 )，250 
Ls command (一 条 关于 列 出 目录 下 文件 的 命令 1s)， 
264 
M 
MAC ( 麦 金 塔 系统 ) 见 Macintosh 
MAC address (介质 访问 控制 地 址 )，346 
Machine language (机 器 语言 )，486-490，488-489f 
Mach kernel (由 卡 内 基 梅 隆 大 学 开发 的 用 于 支持 
操作 系统 研究 的 操作 系统 微 内 核 )，110 
Macintosh (MAC，Mac 系统 ) 
Classic (Mac 标 配 计算 机 系统 )，96 
File System (MFS，Mac 文件 系统 )，98 
512K (Mac 512K 机 型 )，96 
II (Mac-I1 型 计算 机 )，98，102-103 
origin of (Mac 计算 机 的 起 源 )，90-91 
OS Standard File System ( Mac 操作 系统 标准 文 
件 系 统 )，98 
OSX (X 版 Mac 操作 系统 )，109-110，399，418 
ROM (Mac 系统 只 读 存 储 器 )，96 
SE (Mac-II 型 计算 机 )，98 
Mad cow disease (疯牛病 )，144 
Magnetic disk hard-drive (磁盘 硬盘 驱动 器 )，498 
Mailbox (邮箱 )，189 
Main-loop phase (程序 的 主 循环 阶段 )，215 
Main memory ( 主 内 存 ， 简 称 主 存 或 内 存 )，23， 
51, 235f, 497-498 
Major modules (主要 模块 )，24-25，25f 
Management information base(MIB ， 管 理 信 息 库 )， 
354 
Management tools (管理 工具 )，354 
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Many-to-many mapping (多 对 多 映射 模型 )，171 
Many-to-one mapping (多 对 一 映射 模型 )，170 
Mapping addresses (地 址 映射 )，227f，349 
Marshalling (编组 )，396 
Mars Pathfinder (火星 探 路 者 项 目 )，195 
Master boot block (MBB， 主 引导 块 )，437 
Master boot record (MBR， 主 引导 记录 )，307， 
437 
Master chunk pointer (MCT， 主 控 内 存 块 指 针 )，77 
Master file table ( MFT， 主 文件 表 )，284，286， 
428-431 
Master pointer block( 主 指针 块 )，95 
Master pointer table (MPT， 主 控 指 针 表 )，77，78f 
Matchmake (匹配 撮合 )，137 
Maximalist philosophy (最 大 化 哲理 )，16，40 
MD5 (一 种 消息 摘要 散 列 算法 )，376-377 
Mean time between failures ( MTBF ， 平 均 故 障 间 
隔 时 间 )，309 
Media access control (MAC， 介质 访问 控制 )，346， 
505 
Megabytes ( MB，] 048 576 字 节 ， 笼 统计 为 兆 字 
节 ， 即 百 万 字 节 )，498 
Memory (内 存 ) 
overlay (内 存 覆 盖 )，60 
pages (内 存 页 面 )，501 
protection (存储 保护 )，501，501f 
space (内存 空 间 )，25 
unit (存储 器 部 件 )，496-501，501f 
Memory access control (内 存 访问 控制 )，230-231， 
240t 
Memory address (存储 器 地 址 ， 有 时 也 称 为 内 存 
地 址 )，438，496 
Memory allocation (内 存 分 配 )，76-78，77-79f，132 
Memory areas (内 存 区 域 )，236 
Memory bus (存储 器 总 线 ， 或 称 为 内 存 总 线 )，491， 
498 
Memory chunks (内 存 块 )，76 
Memory contents (内 存 内 容 )，60f 
Memory fragmentation (内 存 碎 片 化 )，95 
Memory management (内 存 管理 ) 
advanced memory management, types of (高 级 
的 内 存 管理 ， 类 型 )，248-252 
defined (关于 内 存 管理 的 解释 )，21 
fundamentals of (内 存 管理 基础 )，75-76 


Linux (Linux 操作 系统 内 存 管 理 )，451-452 
Palm (Palm 操作 系统 内 存 管理 )，471-472 
process and (进程 和 内 存 管 理 )，58-63 
single-user multitasking OS and ( 单 用 户 多 任务 
操作 系统 和 内 存 管理 )，75-80 
system (内 存 管 理 系统 )，110 
Windows NT(Windows NT 操作 系统 内 存 管理 )， 
425-427 
见 Basic memory management 
Memory management unit ( MMU， 内 存 管理 部 件 )， 
102-103, 425, 446 
Memory manager ( MM， 内 存 管理 器 ， 或 称 为 内 
存 管 理 程序 )，451 
Memory mapped files (内 存 映 射 文件 )，190，249- 
250，292-293 
Memory pointer table (MPT， 内 存 指针 表 )，472 
Message (消息 ) 
certificates (证 书 )，377 
digest (消息 摘要 )，376-377，376f 
oriented attributes (面向 消息 的 属性 )，185，187 
passing (消息 传递 )，134，184 
queuing (消息 队列 )，189 
signing (消息 签名 )，376f 
Message passing interface, parallel virtual machines 
(MPIPVM， 消 息 传 递 接口 和 并 行 虚拟 机 )， 
134 
Meta-attributes (元 属性 )，431 
Methods (方法 )，37 
Metrowerks (Metrowerks 公司 )，476 
MFT record ( 主 文件 表 记 录 )，429f，430f 
Microelectromechanical systems ( MIEMS ， 微 机 电 
系统 )，325 
Microkernel system ( 微 内 核 系 统 )，34，35f，117， 
118f 
Microprogramming( 微 程序 设计 )，495-496 
Microsoft (微软 公司 ) 
DOS (微软 DOS 操作 系统 )，284 
NFS (微软 网 络 文件 系统 )，399 
OS (微软 操作 系统 )，394 
Windows NT (微软 Windows NT 操作 系统 )，415 
Middleware (中 间 件 )，134，387-388 
Middleware service layer (中 间 件 服务 层 )，387f 
Migration (迁移 )，387 
Minimalist philosophy (最 小 化 哲理 )，16，40 


Miniport drivers (微型 端口 驱动 程序 )，439 
MINIX file system (MINIX 文件 系统 )，115，452 
MIPS (无 联 锁 管道 阶段 的 处 理 器 架构 ) 
CPUs (MIPS 处 理 器 )，446 
R4000 (MIPS R4000 处 理 器 )，248 
RISC processor (MIPS RISC 处 理 器 )，418 
Mirroring (磁盘 镜像 )，309，310 
Mirror of stripes (条 纹 式 单 镜像 )，312 
Mkdir command (用 于 创建 目录 的 命令 mkdir)，264 
Mnemonic name ( 助 记 符 )，491 
Mobile IP (移动 式 网 际 协 议 )，395-396 
Mobile networks (移动 网 络 )，506 
Mobile wearable devices ( 穿戴 式 移动 设备 )，484 
Modal form ( 模 态 窗 体 )，83 
Model (模型 )，333-335 
Modifier field (修饰 符 字段 )，487 
Modules (模块 )，70 
Monitor (监控 程序 ; 管 程 )，48-49，196-197 
Monitor mode (监控 模式 )，29 
Monitor program (监控 程序 )，48 
Monolithic architecture (整体 式 体系 结构 )，25 
Monolithic kernel (整体 式 内 核 ， 或 称 为 大 内 核 )， 
33，116 
Monolithic single-kernel (整体 式 单 内 核 )，33 
Moore's law (摩尔 定律 )，128，140 
Most significant byte (MSB ， 最 高 有 效 字 节 )，187 
Motherboard (主板 )，50 . 
Motorola 68000 (摩托 罗拉 68000 处 理 器 )，91， 
103，109，486 
Motorola 68020 (摩托 罗拉 68020 处 理 器 )，101-103 
Mounting ( 挂 载 )，288-290 
Mouse device driver (鼠标 驱动 程序 )，8 
MPT chaining ( 主 控 指 针 表 链接 )，79f 
MS-DOS (微软 DOS 操作 系统 )，104-105，212- 
213, 352 
MS-DOS partitions (微软 DOS 操作 系统 分 区 )，436 
M68k processor (摩托 罗拉 公司 的 嵌入 式 m68k 处 
理 器 )，446 
MSRPC (微软 远程 过 程 调用 )，461 
Multicast (多 点 传送 ， 或 称 为 多 播 或 组 播 )，184， 
186，404 
Mnulticast addresses (多 播 地 址 )，349 
Multicast packets (组 播 式 数据 包 )，335，336 
Multicore chips (多 核 芯片 )，496 
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Multicore processor (MCP， 多 核 处 理 器 )，124 
MULTICS (MULTICS 操作 系统 )，31，114，236 
MultiFinder (多 重 查找 器 )，98，99-100，99f 
Maultilevel indexed file (多 级 索引 文件 )，279f 
Mnultilevel indexes (多 级 索引 )，278-279 
Mnultilevel page table (多 级 页 表 )，231，426f 
Multilevel queues (多 级 队列 )，160 
Multiple connections (多 个 连接 ， 或 称 之 为 多 重 
连接 )，185，186 
Multiple data streams (多 个 数据 流 ， 或 称 之 为 多 
重 数 据 流 )，435-436 
Moultiple hardware (多 种 硬件 )，421-423 
Multiple interactive users (多 个 交互 式 用 户 ， 即 多 
用 户 交互 )，30 
Mnultiple page size (页 面 大 小 多 样 化 )，233 
Multiple processes (多 进程 )，218-220f，218-222 
Mnultiple threads (多 线程 )，168f 
Multiple tiers (多 层 )，505 
Multiple-user OS (多 用 户 操作 系统 )，113-125 
environment of (多 用 户 操作 系统 环境 )，121- 
123,. 123f 
historical overview of (多 用 户 操作 系统 的 历史 )， 
114-116 
purpose of (多 用 户 操作 系统 的 目的 )，113-114 
Mnultiple users (多 个 用 户 或 多 用 户 )，107-108 
Multiprocessing (MP， 多 处 理 )，48，128-129，132 
Multipurpose Internet mail extensions (MIME ， 多 用 
途 互 联网 邮件 扩充 协议 )，340 
Multitasking (多 任务 )，63 ，69-71，69f，97f 
Multitasking OS (多 任务 操作 系统 )，30 
Multitasking system design (多 任务 系统 设计 )，70 
Multithreaded server (多 线程 服务 器 )，392f 
Mnultithreading (多 线程 )，132 
Musical instrument device interface ( MIDI， 乐 器 
设备 接口 )，472 
Mautex ( 互 斥 机 制 ; 二 值 型 信号 量 ， 即 互 斥 信号 量 )， 
192, -196 
Mutual exclusion ( 互 斥 条 件 ; 互 斥 )，201-202，401- 
402，401f，402f 
N 
Named pipes (命名 管道 )，189 
Name resolution (名 称 解析 )，343 
Name servers (域名 服务 器 )，505 
Name space (名 称 空间 )，394 
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Naming (命名 )，394-396 
Naming strategy (命名 策略 )，184，186 
Nanokernel ( 超 微 内 核 )，103 
National Computer Security Center ( NCSC，, 国家 
计算 机 安全 中 心 )，380 
Native command queuing(NCQ ， 本 地 命令 式 排 队 )， 
321 
N buffer (NN 个 缓冲 区 )，185 
NEC v850 (NEC 公司 的 v850 处 理 器 )，446 
Negative acknowledgment (NACK， 否 定 应答 )， 
405, 405f 
NetBEUI (网 络 基本 输入 /输出 系统 增强 型 用 户 接 
口 协议 )，440，456 
NetBIOS (网 络 基本 输入 /输出 系统 协议 )，345， 
456,461] 
.net remoting (.net 远程 处 理 )，134，135 
Netware (Netware 系统 服务 器 )，345 
Network (网 络 ) 
computer system，use of (计算 机 系统 ， 网 络 的 
使 用 )，504-506，506f 
functional classes of (网 络 功能 类 别 )，31-32 
Linux，use of ( Linux 操作 系统 ， 网 络 的 使 用 )， 
460-462 
troubleshooting (网 络 故障 排查 )，354 
types of (网 络 分 类 )，506 
Windows NT，use of ( Windows NT 操作 系统 ， 
网 络 的 使 用 )，440-441 
Network access (网 络 访问 )，24 
Network adapter (网 络 适配器 )，346 
Network address translation (NAT， 网 络 地 址 转 
换 )，344 
Network attached storage (NAS， 网 络 附属 存储 
器 )，129 
Network controller (网 络 控制 器 )，505 
Network devices (网 络 设备 )，299，455-457 
Network driver interface specification (NDIS， 网 
络 驱动 程序 接口 规范 )，440 
Network file system (NFS， 网 络 文件 系统 )，289- 
292，292f，387，399 
Network General Corporation (网络 通用 公司 )，355 
Network interface (NET， 操 作 系统 的 网 络 接口 模 
块 )，460 
Network interface card (NIC， 网 络 接口 卡 ， 简 称 
网 卡 )，346，349，460 


Network interface controller (NIC， 网 络 接口 控制 
器 )，505 

Network IO devices (网 络 型 输入 /输出 设备 )，502 

Network layering (网 络 分 层 )，460-461，461f 

Network management (网 络 管理 )，354-355 

Network Neighborhood protocols (网 上 邻居 协议 )， 
461 

Network News (网 络 新 闻 )，399 

Network Object Model Environment (网 络 对 象 模 
型 环境 )，459 

Network programming (网 络 编程 )，473-474，475t 

Network protection (网 络 保护 )，378-380，379f 

New state (新 状态 )，27，154-155 

New Technology (NT， 新 技术 ， 即 NT 操作 系统 
名 称 的 寅 意 )，418 

NeXT Computer Inc. (NeXT 计算 机 公司 )，38，107， 
110 

Next fit (循环 首次 适应 算法 )，220 

NextStep OS (NextStep 操作 系统 )，38，107 

Nice command (一 条 用 来 改变 程序 优先 级 的 命令 
nice), 449-450, 450 

Nmap (一 款 端 口 扫描 程序 ， 指 网 络 映射 器 )，462 

No buffer (没有 缓冲 区 )，185 

Nodes (进程 状态 转换 图 中 的 结 点 ; 集群 中 的 节点 ; 
处 理 器 节点 )，26，129，145 

No guarantee semantics (不 保证 性 语义 )，408 

Nonblocking read ( 非 阻 塞 式 读 取 )，188 

Non-moveable chunks (不 可 移动 的 内 存 块 )，78 

Nonresident attributes (非常 驻 属 性 )，429-430 

Non-Uniform Memory Access (NUMA ， 非 均匀 性 
内 存 访 问 )，129 

Nonvolatile memory ( 非 易 失 性 存储 器 )，499 

Noop scheduler (Noop 调度 器 )，315，458 

Normal process (普通 进程 )，449 

Notebook computer (笔记 本 计算 机 ， 或 称 为 笔记 
本 电脑 )，484 

Notepad (一 款 文 本 编辑 器 程序 名 称 ， 寅 意 记 事 本 )， 
92，264 

Not recently used (NRU， 最近 未 使 用 算法 )，244 

Not used recently (NUR， 最 近 未 使 用 算法 )，244 

Novell Directory Service (NDS ,Novell 目录 服务 )， 
395 

Novell Netware( 诺 勒 公司 网 络 操作 系统 )，184，440 

Novolatile random access memory (NVRAM， 非 


易 失 性 随机 访问 存储 器 )，75-76 

N-step SCAN (N 轮 向 前 看 调度 算法 )，320 

N10 (N-Ten) (处 理 器 芯片 名 ; 微软 所 用 i860 仿真 
器 名 称 )，418 

NT file system (NTFS，NTFS 文件 系统 ， 或 称 为 
NT 文件 系统 )，428-433 

advanced features of ( NTFS 文件 系统 高 级 功能 
特征 )，433-436 
goals of (NTFS 文件 系统 的 目标 )，431-433 

N-tier applications (入 层 应 用 程序 )，389-390，390f 

NTLM (NT 局 域 网 管理 器 )，462 

NT-style printing service ( SPOOLSS，NT- 风格 打 
印 服务 )，462 

NuBus (苹果 系统 总 线 名 称 ， 寅 意 新 型 总 线 )，104 

Null pointer catcher ( 空 指针 捕获 器 )，425 

Number of records (记录 数 )，57 

O 

Object (对 象 )，37，81，83 

Object adapter (对 象 适配器 )，398 

Object code (目标 代码 )，491 

Object linking and embedding ( OLE ， 对 象 链接 和 
嵌入 )，434 

Object Management Group ( OMG ， 对 象 管理 组 )， 
398 

Object module ( 目标 模块 )，210 

Object-oriented approach (面向 对 象 的 方法 )，37-38 

Object-oriented architecture (面向 对 象 的 体系 结构 )， 
25 

Object programs (目标 程序 )，491 

Object request broker (ORB， 对 象 请 求 代 理 )，398 

Offline storage( 离线 存储 器 ， 或 称 为 脱 机 存储 器 )， 
499 

Offset ( 偏 移 量 )，487 

One buffer (一 个 缓冲 区 ， 或 称 为 单 缓冲 )，185 

One-to-one mapping (一 对 一 映射 )，170 

One-to-one thread mapping model (一 对 一 线程 映 
射 模型 )，170f 

One-way connections (单一 连接 )，184，185 

Online storage( 在 线 存 储 器 ， 或 称 为 联机 存储 器 )， 
499 

Opcode (operation code， 操 作 码 字段 )，486 

Open files (打开 的 文件 )，26 

Open files table (打开 文件 表 )，37 

OpenGL (一 套 三 维 图 形 处 理 库 )，109 
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Open Group (开放 集团 )，398 
Open shortest path first ( OSPF， 开 放 式 最 短路 径 
优先 协议 )，342 
Open source implementations (开源 实现 )，465t 
Open source projects (“开源 ”项 目 )，115 
Open Source Samba (开源 Samba 软件 包 )，345 
Open source systems (开源 系统 )，8 
Open standards (开放 标准 )，387 
Operand fields (操作 数字 段 )，487 
Operating system (OS， 操 作 系 统 )，3-17 
basic functionality’s of (操作 系统 基本 功能 ), 5-6 
basic terminology of (操作 系统 基本 术语 )，10- 
11 
concepts of (操作 系统 的 概念 )，138-142 
functions of (操作 系统 的 功能 )，20-25，25f 
historical overview of (操作 系统 发 展 概述 )，15- 
17, 16f 
images of (操作 系统 视图 )，11-13，12f，13f 
360 TSO ( 带 有 分 时 选项 的 360 操作 系统 )，31 
2 (OS/2 操作 系统 )，295，417，422，428，452 
Optimal page replacement ( OPT， 最 佳 页 面 淘汰 算 
法 )，241 
ORG 100 (一 条 将 模块 放 在 位 置 100 的 汇编 指令 )， 


21l, 212 
ORG 500 (一 条 将 模块 放 在 位 置 500 的 汇编 指令 )， 
211 


Orphan process (孤儿 进程 )，165 

OSI model (开放 系统 互 连 参考 模型 ， 或 称 为 开放 
系统 互 连 模型 )，334，334f 

Output devices (输出 设备 )，484-485 

Overlay (覆盖 )，48，51，62 

Overlay memory management (覆盖 式 内 存 管理 )， 
61-63，62f 

Overlay single process (支持 覆盖 的 单一 进程 )，215， 
2136 

Overloading ( 重 载 )，288 

P 

Packet capture (数据 包 捕获 )，355 

Page access (页 面 访 问 )，230-231 

Page access protection (页 面 访问 保护 )，227f，230- 
231 

Page directory (页 目录 表 )，426 

Paged memory access (基于 分 页 的 内 存 访问 )，227f 

Page fault〈 缺 页 故障 )，102，239，427 
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Page fault frequency (PFFE， 页 面 故障 频率 )，245 

Page locking (页 面 锁 定 )，246-247 

Page mapping (页 面 映 射 )，227f，426，426f 

Page reference bit (页 面 引用 位 )，242 

Page replacement (页 面 替 换 ， 或 称 为 页 面 置换 或 
页 面 淘汰 )，240，427 

Page sharing (分 页 共享 )，426-427 

Pages per process (每 进程 页 框 )，244-245 

Page table (页 表 )，37，233 ，501 

Page table address register (页 表 地 址 寄存 器 )，227 

Page table demand paging (请求 分 页 式 页 表 )，239f 

Page table length register (页 表 长 度 寄存 器 )，230 

Paging (分 页 )，226-233 

PAI (个 人 应 用 集成 )，480 

Palm，Inc. (Palm 公司 )，67，69 

Palm OS (Palm 操作 系统 )，71-73 ，72f, 469-480 

Palm Pilot (Palm Pilot 手持 式 掌 上 电脑 )，69f 

Palm Powered™ (Palm Powered 手持 式 设备 )，474 

PalmSource，Inc. (PalmSource 公司 )，70，480 

Palm Sync ( Palm 系统 的 一 款 应 用 程序 ， 用 于 实 
现 手 持 式 装置 上 的 数据 库 文 件 与 个 人 计算 机 
上 的 数据 库 文件 之 间 的 同步 )，74 

Pande Group ( 潘 德 小 组 )，144 

Parallel computing (并 行 计 算 )，128 

Parallel connection (并 行 连接 )，504 

Parallelism (并 行 )，128 

Parallel Line Internet Protocol (PLIP， 并 行 线路 互 
联网 协议 )，457 

Parallel processing (并 行 处 理 )，128-132，130f，131f 

Parent process( 父 进程 )，123，164-165 

PA-RISC (惠普 公司 的 PA-RISC 处 理 器 )，446 

Parity schemes (奇偶 校 验 方案 )，312f 

Partially connected mesh (网 状 网 络 拓 扑 结 构 )，337f 

Partitioning (分 区 )，306，306f 

Partitions (磁盘 分 区 )，305-306，436-437 

Partition table (分 区 表 )，307 

Pascal (Pascal 程序 设计 语言 )，39，476 

Passwords (密码 )，108，367 

Patch (修补 ， 即 打 补 丁 )，211 

Path (路 径 名 或 路 径 )，261，394 

PC (个 人 计算 机 ) 

Card (个 人 计算 机 卡 ， 或 称 为 PC 卡 )，104，353， 
438，446 
characteristics of (个 人 计算 机 的 特征 )，50-52， 
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Exchange ( 7.1 版 Mac 操作 系统 上 的 一 款 能 够 
访问 MS-DOS 格式 软盘 的 软件 ， 寓 意 “ 个 人 
计算 机 交换 ”)，104 
MCIA ( 插 槽 类 型 名 称 ， 寓 意 个 人 计算 机 存储 卡 
国际 协会 )，104-105，438 
OS (个 人 计算 机 操作 系统 )，90 
relative addressing (程序 计数 器 相对 寻 址 )，487 
PDP-7 (一 款 小 型 计算 机 )，114 
Peer-to-peer (P2P， 点 对 点 系统 ; 对 等 模型 )，130， 
504 
Pentium (奔腾 处 理 器 )，137 
Performance (性能)，182，386 
Performa 6100 (一 款 Mac 计算 机 型 号 )，103 
Peripheral Component Interconnect (PCI， 外 围 部 
件 互 连 )，104 
Peripheral devices (外 围 设备 )，502 
Per-process open file table (进程 打开 文件 表 )，122 
Persistence (持久 性 )，188，387 
Persistent attributes (持久 通信 属性 )，185 
Persistent data (持久 性 数据 )，76 
Personal area networks (PANs， 个 人 区 域 网 络 )，353 
Personal data interchange (PDI， 个 人 数据 交换 )，474 
Personal data synchronization (个 人 数据 同步 )，473- 
474 
Personal desktop computer (个 人 台式 计算 机 )，484 
Personal digital assistant (PDA， 个 人 数字 助理 ， 
或 称 为 掌上 电脑 )，4，68，353 ，473 
Personal identification number (PIN， 个 人 身份 号 
码 )，367 
Personal information managers ( PIMs， 个 人 信息 
管理 器 )，68 
Personal Software (个 人 软件 公司 )，417 
Personal Web Sharing (个 人 网 页 共享 )，105 
Per-user disk space quotas (每 用 户 磁盘 空间 配额 )， 
434 
Phishing (网 络 钓 鱼 )，367 
Physical address extension (PAE， 物 理 地 址 扩展 )， 
102, 214, 446 
Physical disk organization (磁盘 物理 组 织 )，302- 
305, 302f, 305t 
Physical layer (物理 层 )，334，352-354 
Physical location of information (信息 的 物理 位 置 )， 
183，386 


Physical memory space (物理 内 存 空 间 )，132 

Physical space (物理 空间 )，214 

Physical structure (物理 结构 )，262 

Physical virtual machine (物理 虚拟 机 )，392-393， 
393f 

Pickup (搭便 车 调度 算法 )，315，316f 

Ping (一 种 用 于 验证 两 台 设备 之 间 连 接 的 实用 工 
具 例 程 )，354 

Ping of Death〈 死 乒 攻击 )，363 

PINGs (“拼接 ”测试 )，345 

Pipeline architectures (流水 线 体系 结构 )，194 

Pipeline flow graph (管道 流 图 )，131f 

Pipelining (流水 线 )，494 

Pipes (管道 )，188 

Plain old telephone service (POTS ， 普 通 老 式 电话 
服务 )，350，351 

Plaintext (消息 明文 )，374 

Platform agnostic (平台 无 关 的 )，134 

Plug and play (PnP， 即 插 即 用 )，437-438 

Pocket PC (掌上 电脑 )，68 

Pointing device (指针 式 设备 )，8，17 

Point-to-Point Protocol (PPP， 点 对 点 协议 )，457 

Polling ( 轮 询 )，300 

POP3 (post office protocol version 3， 第 三 版 邮局 
协议 )，340-341，344，461 

Port (端口 )，189，439 

Port 21 (21 号 端口 )，340 

Port 80 ( 80 号 端口 )，339，340 

Portability (可 移植 性 )，49，52 

Portable batch system (PBS， 轻 便 型 批 处 理 系统 )， 
129, 145-146 

Portals (门户 )，146-147 

Port mirroring (端口 镜像 )，355 

Port number (端口 号 )，338 

Port scanners (端口 扫描 程序 )，462 

POSIX (UNIX 可 移植 操作 系统 接口 )，115，173- 
174 

Power Macintosh (强力 Mac 计算 机 )，103 ，104 

Power-On Self-Test (POST， 开 机 自 检 )，96 

PowerPC (一 款 处 理 器 ， 富 意 强力 个 人 计算 机 )， 
103，110，418 

Practical network layer model (实用 的 网 络 层次 模 
型 )，334f 

PRC-Tools (一 款 基于 gcc 的 采用 C/C++ 语言 来 
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构建 Palm 操作 系统 应 用 程序 的 编译 器 工具 
链 )，476 
Preallocation( 预 分 配 )，270 
Preemption (抢占 )，75，159，205-206 
Preemptive multitasking (抢占 式 多 任务 )，124，110 
Prefetch file( 预 提取 文件 )，251 
Prefetch profiles( 预 取 配 置 )，427 
Pretty good privacy (PGP， 人 恰到好处 隐私 协议 )， 
378 
Prevention ( 死 锁 预 防 )，201-203 
Primary data ( 主 数据 )，267 
Primary key (主键 )，267 
Primary memory，management of ( 主 内 存 或 称 为 
主 存 或 内 存 ， 管 理 )，209-210 
Primary partitions ( 主 分 区 )，306 
Primary rate interface (PRI， 主 速率 接口 )，351 
Primary storage ( 主 存储 器 )，70，496-497，498 
Printer queue (打印 机 队列 )，37 
Priority inversion (优先 级 倒置 )，195 
Priority scheduling (优先 级 调度 )，157 
Priority with preemption (抢占 式 优 先 级 )，159 
Private key ( 私 钥 )，375 
Privileged mode (特权 模 式 )，29，490 
Problems and threats (问题 与 威胁 ) . 见 Security 
and protection 
Process (进程 ) 
concept of (进程 的 概念 )，25-27 
defined (关于 进程 的 解释 )，20，151 
types of (进程 分 类 )，28-29 
Process control block (PCB ， 进 程控 制 块 )，28，28f， 
152-153, 153f 
Process descriptor (进程 描述 符 )，152 
Processes (进程 )，28-29 
Process groups (进程 组 )，407 
Process identifier (ID， 进 程 标识 符 )，28 
Processing graffiti input (处 理 涂鸦 式 输 入 )，73 
Processing node (处 理 节点 )，131 
Process management (进程 管理 )，21，151-178 
Processor (处 理 器 )，485-496 
Processor affinity (人 处理 器 亲 和 性 )，133，164 
Processor cache (处 理 器 高 速 缓存 )，491 
Processor chip (处理 咒 芯片)，496 
Processor control (处 理 器 控制 )，491-492 
Processor data path (处 理 器 数据 通路 )，491-492 
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Processor instruction execution cycle (处 理 器 指令 
执行 周期 )，493-494 
Processor instruction set architecture (处 理 器 指令 
集体 系 结构 )，486-490 
Processor interrupts (处 理 器 中 断 )，494-495 
Processor machine language (处 理 器 机 需 语 言 )， 
486-490，488f，489f 
Processor microprogramming (处 理 器 微 程序 设计 )， 
495 
Processor multicore chips (处 理 器 多 核 芯 片 )，496 
Processor pipelining (处 理 器 流水 线 )，493-494 
Process resilience《〈 进 程 韧性 )，407-408，407f，408f 
Process scheduler (进程 调度 器 ， 或 称 为 进程 调度 
程序 )，27，75 
Process Scheduler module ( SCHED ， 进 程 调 度 模 
块 )，447 
Process Scheduling (进程 调度 ) 
Linux (Linux 操作 系统 进程 调度 )，447-450 
single-user multitasking OS，use of ( 单 用 户 多 
任务 操作 系统 ， 进 程 调度 的 使 用 )，73-75 
Windows NT(Windows NT 操作 系统 进程 调度 )， 
423-424 
Process sharing (共享 进程 中 代码 和 数据 )，168f 
Process state information (进程 状态 信息 )，153 
Process states (进程 状态 )，25-27，26f，152，154 
Process Synchronization (进程 同步 )，138-140 
Process threads (进程 线程 )，123-125，123t，125f， 
172-173 
Proc file system (进程 文件 系统 /proc)，454 
Producer-consumer problem (生产 者 -消费 者 问 
题 )，195-196 
Program binary (二 进 制程 序 ; 程序 二 进 制 文件 )， 
59, 491 
Program counter (程序 计数 器 )，25，152，492 
Program header (程序 头 )，61 
Program image (程序 映像 )，59 
Programmable read-only memory (PROM， 可 编程 
只 读 存 储 器 )，71，75-76 
Programmer fragmentation (程序 员 碎片 )，274，275 
Programming (程序 设计 ， 或 编程 )，439，458-460 
Programming environments (编程 环境 )，475-476 
Program processor (程序 处 理 器 )，491 
Programs (程序 )，491 
Program status registers (程序 状态 寄存 器 )，492 


Progress dialog (进度 对 话 框 )，83 

Promiscuous mode (混杂 模式 )，355 

Proportional allocation ( 按 比 例 分 配 )，245 

Protection and security (保护 与 安全 ) . 见 Security 
and protection 

Pseudo file system ( 虚 文 件 系 统 ， 或 称 为 伪 文 件 系 
统 )，454 

Psion〈 佩 森 公 司 )，476 

Pthreads (一 项 与 线程 有 关 的 POSIX 标准 )，173， 
174 

Public key ( 公 钥 )，375 

Purchased components (组件 购买 )，182，386 

Q 

Quality of service (QoS， 服 务 质量 )，348 

Quantum (时 间 片 ， 即 额定 时 间 量 )，447 

QuickTime (一 款 多 媒体 软件 ， 寓 意 快乐 时 光 )， 
102 

R 

Race condition ( 竞 态 条 件 )，138，191 

Race hazard (竞争 险象 )，191 

RAID (redundant array of independent disks， 廉 价 
磁盘 元 余 阵列 )，309-314 

RAID failure (廉价 磁盘 元 余 阵列 故障 )，313-314 

RAM disk driver (内 存 型 磁盘 驱动 程序 ， 或 称 为 
RAM 磁盘 驱动 程序 或 随机 存 取 存储 器 型 磁 
盘 驱动 程序 )，473 

RAM management (内 存 管 理 ， 或 称 为 随机 存 取 
存储 器 管理 )，100 

RAM methods (随机 存 取 存储 器 方法 )，266-267， 
266f 

RAM sequential access (随机 存 取 存储 器 顺序 访 
问 )，298 

Random access( 随 机 存 取 ， 或 称 为 随机 访问 )，266- 
267，266f 

Random access memory (RAM， 随 机 访问 存储 器 ， 
或 称 为 随机 存 取 存储 器 )，50，75-76 

Raw access (原始 存 取 )，268-269 

Raw access method (原始 存 取 方 法 )，268-269 

Raw interface (原生 接口 )，82 

Raw IO (原始 输入 /输出 )，299，306 

Read message ( 读 取 消息 )，373 

Read next operation ( 读 取 下 一 条 记录 的 操作 命令 )， 
266 

Read-only memory (ROM， 只 读 存 储 器 )，6，14， 


48, 71, 75-76, 96 

Read-only support (只 读 支持 )，433 

Read-the-button software (一 款 名 为 read-the-button 
的 软件 )，5 

ReadyBoost ( 闪 速 缓存 机 制 )，420 

Ready process queue (就 绪 进 程 队列 )，22-23，37， 
156 

Ready state (就 绪 状 态 )，27，155，156 

Ready to run (就 绪 状 态 )，26 

Real-time application interface ( RTAI， 实 时 应 用 
程序 接口 )，464 

Real-time functional classes (实时 功能 类 型 )，32- 
33 

Real-time Linux common API (实时 Linux 通用 应 
用 程序 接口 )，463-464 

Real-time OS (RTOS， 实 时 操作 系统 )，464 

Real-time processes (实时 进程 )，448-449 

Real-time tasks (实时 任务 )，471 

Real-time threads (实时 线程 )，424 

Records (记录 )，80-81 

Recoverability (可 恢复 性 )，431，431-432 

Redirection ( 重 定向 )，290-292，291f，292f，437 

Redirector ( 重 定向 器 )，292 

Reduced Instruction Set Compnuter ( RISC， 精 简 指 
令 集 计 算 机 )，418，486 

Reed-Solomon codes (里 德 - 所 风门 码 )，308 

Reentrancy (重信 )，172 

Reference count (引用 计数 )，242 

Regions (区 域 )，236 

Register (寄存 器 )，491-492，497 

Register addressing (寄存 器 寻 址 )，487 

Registration functions (注册 函数 )，119t 

ReiserFS (一 种 新 型 Linux 文件 系统 )，295 

Relative pathname (相对 路 径 名 )，263 

Release number (版 本 号 )，116 

Reliability (可 靠 性 )，183，386 

Reliable client-server Communication (可 靠 的 客户 
端 - 服 务 器 通信 )，408 

Reliable multicast communication (可 靠 的 多 播 通 
信 )，404-405，405f 

Reliable sleep state (可 靠 的 睡眠 状态 )，420 

Relocation ( 重 定 位 )，387 

Relocation hardware ( 重 定位 硬件 )，213，213f 

Remainder section (剩余 区 )，192 
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Remote file systems (远程 文件 系统 )，289-290 

Remote method invocation (RMI， 远 程 方法 调用 )， 
134，141 

Remote monitoring (RMON ， 远 程 监控 )，355 

Remote procedure call (RPC， 远 程 过 程 调用 )，141， 
187, 392, 396-398,，397f 

Remote services，use of (远程 服务 ， 运 用 )，141-142 

Removable dises (可 移动 磁盘 )，498-499 

Removable medium (可 移动 介质 )，371 

Reparse point ( 重 解析 点 )，435 

Replacement algorithms (淘汰 算法 ， 或 称 为 置换 
算法 )，243-244 

Replicated database (复制 型 数据 库 )，391 

Replication (复制 )，387 

Replication transparency (复制 透明 性 )，32 

Repudiate (否认 )，377 

Request for comments ( RFC， 互 联网 标准 草案 )， 
335-337 

Reserved area (保留 区 )，55 

Resident attributes ( 常 驻 属性 )，428-429 

Resource-allocation graph (资源 分 配 图 )，200，200f 

Resource management,types of( 资源 管理 ， 类 型 )， 
22-24 

Resource processes sharing (进程 共享 资源 )，198f 

Resources (资源 )，81 

Resource utilization (资源 利用 率 )，132 

Ring topologies (环形 网 络 拓 扑 结 构 )，337f 

Ritchie，Dennis (丹尼斯 * 里 奇 )，114 

Rivest，Shamir，Adleman ( RSA， 一 种 公开 密 钥 
加 密 标 准 算法 )，376 

Rm command (一 条 用 来 删除 文件 的 命令 rm)，264 

Rmdir command (一 条 用 来 删除 目录 的 命令 rmdir)， 
204 

Robots (机 械 人 ， 即 僵尸 机 器 )，363 

Roles (角色 )，369-370 

Roll-out/roll-in〈 滚 出 /深入 技术 )，216 

Rotational latency (旋转 延迟 时 间 )，304-305 

Round robin (轮转 策略 )，159，449 

Routers (路 由 器 )，342，353，505 

Routing information protocol(RIP， 路 由 信息 协议 )， 
342 

RPC stub (远程 过 程 调用 的 桩 例 程 )，397f 

RSA protocol (RSA 协议 )，375 

RTLinux (一 种 基于 Linux 操作 系统 内 核 的 实时 系 
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统 模型 )，464 

Run (运行 )，210 

Runnable program (可 运行 程序 )，59 

Running (运行 的 )，26 

Running state (运行 状态 )，27 

Runqueue (运行 队列 )，447，448 

S 

Safe state (安全 状态 )，204f 

SAINT (一 款 知 名 的 端口 扫描 软件 )，462 

SAMBA (一 套 在 UNIX 和 Linux 操作 系统 中 用 来 
访问 微软 服务 器 的 软件 包 )，461-462 

Sandbox ( 沙 箱 )，365 

Sandbox execution model ( 沙 箱 执行 模型 )，365f 

SATAN (一 款 知名 的 端口 扫描 软件 ， 寓 意 网 络 分 
析 安 全 管理 员工 具 ), 462 

Scaling (规模 扩展 ， 或 称 为 伸缩 性 )，182，386 

SCAN (扫描 算法 )，318 

Scandisk (磁盘 检查 修复 工具 例 程 )，293 

Sched_setparam (一 个 用 来 更 改进 程 自 身 优先 级 
的 操作 系统 函数 )，450 

Scheduling，Pprocess (调度 ， 进 程 )，156-164 

Scientific computing (科学 计算 )，142-143 

Screen savers (屏幕 保护 程序 )，332 

Screen size (屏幕 尺寸 )，72 

Screen window (屏幕 窗口 )，74 

Scripts (脚本 )，59，365-366，365f 

SDLC (同步 数据 链 路 控制 协议 )，184 

Search for Extra-Terrestrial Intelligence (SETI， 外 
星 文 明 探 寻 项 目 )，175，183 

Secondary key (次 键 )，267 

Secondary storage (辅助 存储 器 ， 或 称 为 第 二 级 存 
储 器 )，23，71，81，498 

Second chance algorithm (二 次 机 会 算法 )，243 

Secret key (隐秘 密 钥 )，375 

Sector addressing ( 扇 区 编 址 )，303-304 

Sector count zones( 户 区 分 组 区 )，303-304 

Sector relocation ( 扇 区 迁移 ， 或 称 为 户 区 重 定位 )， 
323-324 

Sectors ( 刷 区 )，54，302-303 ，302f 

Sector sparing ( 扇 区 保留 )，323-324 

Secure Accounts Manager ( SAM， 安 全 账户 管理 器 )， 
461 

Secure hash standard (SHA ， 安 全 散 列 标准 算法 )， 
377 


Secure HTTP protocol (安全 超 文 本 传输 协议 )，378 
Secure socket layer (SSL， 安 全 套 接 字 层 协议 )，378 
Security administration (安全 管理 )，380 
Security and protection (安全 与 保护 )，359-381 
policies for (关于 安全 与 保护 的 策略 )，370-373 
problems concerning (关于 安全 与 保护 的 问题 )， 
360-366 
techniques for (关于 安全 与 保护 的 技术 )，370- 
373 
threats concerning (关于 安全 与 保护 的 威胁 )，360- 
366 
Security descriptor (安全 描述 符 )，430 
Security-Enhanced Linux ( SELinux，Linux 安全 增 
强 模块 )，462 
Security protocols (安全 协议 )，377-378 
Seek ( 寻 道 )，304-305，305t 
Seek time ( 寻 道 时 间 )，304 
Segmentation (分 段 )，233-236 
Segmentation with paging ( 段 页 式 )，236-238，237f 
Segmenting a process (进程 分 段 )，234f 
Segment number (s， 段 号 )，234 
Self-monitoring and reporting technologies (S.M.A.R.T., 
自我 监控 报告 技术 )，324 
Semaphore (信号 量 )，193 
Send message (发 送 消息 )，373 
Sequential access (顺序 存 取 ， 或 称 为 顺序 访问 )， 
265-267,. 265f 
Sequential file with current record pointer (顺序 文 
件 及 当前 记录 指针 )，265f 
Serial connection ( 串 行 连接 )，504 
Serial Line Interface Protocol ( SLIP， 串 行 线路 接 
口 协议 )，457 
Server computers (服务 器 计算 机 )，484 
Server message block (SMB， 服务 器 消息 块 协议 )， 
345, 399, 461 
Servers (服务 器 )，31，32 
Services (服务 )，11 
Service security improvements (服务 安全 提升 )，419 
Service shutdown ordering (服务 关闭 排序 机 制 )， 
420 
Service variability (服务 可 变性 )，319 
SETI@Home (外 星 文明 探寻 之 家 )，130，137，144 
SETI project (外 星 文明 探寻 项 目 )，332 
SHA-1 (一 种 用 来 生成 散 列 码 的 算法 )，378 


Shared key (共享 密 钥 )，375 

Shared memory (共享 存储 器 ， 或 称 为 共享 内 存 )， 
190，192f 。 

among processes (进程 间 共 享 内 存 )，248-249 
systems (共享 内 存 系统 ， 或 称 为 共享 存储 器 系 

统 )，190 

Shared variable (共享 变量 )，191f 

Shell (外 过 程序， 即 命令 解释 器 )，60 

Shell command (外壳 程序 命令 ， 或 称 为 shell 命 
令 )，166 

Shell interpreter (shell 命令 解释 器 ， 即 外 壳 程序 )， 
11 

Shielded twisted pair (STP) wiring (屏蔽 型 双 绞 线 
布线 方式 )，352 

Shift (Shift 按键 )，6 

Shmid (共享 内 存 标识 符 )，249 

Shortest job next (SJIN， 最 短 作业 优先 调度 )，158 

Shortest positioning time first (SPTF ， 最 短 定位 时 
间 优 先 调度 算法 )，316-317，316f 

Shortest remaining time first ( SRTF ， 最 短 剩余 时 
间 优 先 调度 )，158-159 

Shortest runtime first ( SRTF ， 最 短 运行 时 间 优 先 
调度 )，158 

Shortest seek time first ( SSTF， 最 短 寻 道 时 间 优 
先 调度 算法 )，316 

Short message service (SMS ， 短 信服 务 )，474，479 

Short-term scheduler (短程 调度 器 )，156 

Signal system call (signal 系统 调用 )，193 

Signal routine (signal 例 程 )，194 

Signatures (签名 )，379 

Silicon Graphics ( Silicon Graphics 计算 机 系统 )， 
248, 418 

Simple mail transfer protocol ( SMTP， 简 单 邮件 传 
输 协 议 )，340-341，344 

Simple Network Management Protocol ( SNMP， 
简单 网 络 管理 协议 )，354-355，441 

Simultaneous multithreading (SMT， 同 时 多 线程 )， 
172 

Single connections (单一 连接 )，185，186 

Single instance storage (SIS， 单 实例 存储 )，434 

Single-level directory ( 单 级 目录 )，259-260，260f 

Single process of memory management (单一 进程 
内 存 管理 )，211-216 

Single-process OS ( 单 进程 操作 系统 )，47-63 
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Single tasking ( 单 任务 )，92-93，93f 

Single UNIX Specification (SUS， 单 一 UNIX 规 
范 ) 15 

Single user (单一 用 户 )，30 

Single-user mnultitasking/multithreading OS ( 单 用 
户 多 任务 / 多 线程 操作 系统 )，89-110 

historical overview of ( 单 用 户 多 任务 /多 线程 
操作 系统 发 展 概述 )，89-90 
origin of ( 单 用 户 多 任务 / 多 线程 操作 系统 的 起 

源 )，90-91 

Single-user multitasking OS ( 单 用 户 多 任务 操作 系 
统 )，67-85 

Single-user single-tasking OS ( 单 用 户 单 任务 操作 
系统 )，29 

Single-user systems ( 单 用 户 系统 )，15 

Skeleton (程序 框架 )，398 

Slab allocator (内 存 对 象 集 分 配器 ， 或 称 为 Slab 
分 配器 )，451 

Sleep mode (睡眠 模式 )，71 

Sliding window (滑动 窗口 )，240 

Small computer system interface ( SCSI， 小 型 计算 
机 系统 接口 )，118，439 

Small real-time OS (小 型 实时 操作 系统 )，464 

Small records ，blocking of (针对 短小 记录 的 分 块 
技术 )，301-302 

Small systems device families (小 微 系统 设备 系列 )， 
479t 

Smalltalk (Smalltalk 编程 语言 )，476 

S.M.A.R.T. (自我 监控 报告 技术 )，324 

SMP load balancing (对 称 多 处 理 负载 均衡 )，450 

SMP systems (对 称 多 处 理 系统 )，194-195 

SNA (系统 网 络 体系 结构 )，184，344，456 

Sniffer (一 种 用 于 捕获 数据 包 的 嗅 探 器 软件 )，355 

Snooping (神探 )，195 

Socket ( 套 接 字 )，189，456 

Socket buffer (skbuff， 套 接 字 缓冲 区 )，460 

Soft deadlines( 软 性 的 截止 时 间 )，32 

Software，OS (软件 ， 操 作 系 统 )，12f 

Software Development Kit(SDK， 软 件 开发 工具 )， 
476 

Software events (软件 事件 )，495 

Software tools (软件 工具 )，132 

Solaris (Solaris 操作 系统 )，33，110，175-176，249 

Solutions，ieal-world (实用 的 解决 方案 )，205-206 
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Sony (索尼 公司 )，69 

Source code ( 源 代 码 )，491 

Source programs ( 源 程 序 )，491 

Source route bridging ( 源 路 由 桥接 )，348 

Space tracking (空间 监测 )，431 

SPAM email (垃圾 邮件 )，345 

Spanning tree (生成 树 )，347 

SPARC (斯 巴克 处 理 器 )，446 

Sparse files (稀疏 文件 )，434-435 

Spatial locality (空间 局 部 性 )，500 

“Spawning a child” (产生 一 个 子 进程 )，165 

Special forms ，types of (特殊 的 窗 体 类 型 )，83-84 

Special memory management (特殊 的 内 存 管理 )， 
249-251, 252f 

Special-purpose registers (专用 寄存 器 )，492 

Speed of light (光速 )，128 

Speeds (速度 )，304-305，305t 

Spin-lock( 自 旋 锁 )，193 

SPOOLING system ( 假 脱 机 系统 )，157 

Spyware (间谍 软件 )，362-363 

Stack (堆栈 ， 或 简称 栈 )，61 

Stack sniffer ( 栈 嗅 探 器 )，95 

Stack space ( 栈 空间 )，166 

Standard file systems (标准 文件 系统 )，452 

Standard information (标准 信息 )，430 

Star topologies ( 星 形 网 络 拓 扑 结 构 )，337f 

Startup speed of XP ( XP 操作 系统 启动 速度 )，441- 
442 

Starvation ( 饥 俄 问题 )，157 

Stateless (无 状态 的 )，366 

States (状态 )，28，154-156，154f，494 

State transitions (状态 转换 )，26 

Static data (静态 数据 )，59，61 

Static IP address (静态 的 网 际 协议 地 址 )，343 

Static random access memory ( SRAM， 静 态 随 机 
存 取 存 储 器 )，497 

Status-driven system (状态 驱动 的 系统 )，36 

Stderr (standard error， 标 准 错误 输出 接口 )，82 

Stdin (standard input， 标 准 输入 接口 )，82 

Stdin/stdout function (标准 输入 /输出 接口 函数 )， 
472 

Stdout (standard output， 标 准 输出 接口 )，82 

Stealth port scanners( 隐 式 端 口 扫描 器 )，462 

Storage area network (SAN， 存 储 域 网 络 )，129 


Storage class (存储 类 )，439 

Storage driver (存储 类 驱动 程序 )，439 

Storage hierarchy (存储 体系 ， 或 称 为 存储 器 层次 
结构 )，484，497-500，497f，501f 

Storage IO devices (存储 型 输入 /输出 设备 )，502 

Storage port (存储 端口 )，439 

Storage random access memory (存储 型 随机 访问 
存储 器 )，76 

Storage units (存储 单位 )，496-497 

Storage volatility (存储 易 失 性 )，498 

Streaming ( 流 )，185，187 

Stream 1/O0( 流 输入 /输出 )，472 

Stream of data (数据 流 )，187 

Strict priority mechanism (严格 的 优先 级 调度 机 
制 )，160 

Strip (条 纹 划分 )，309 

Striped disk array (条 纹 式 磁盘 阵列 )，309-310 

Stripe of mirrors (条 纹 式 多 镜像 )，312-313 ，312f， 
313f 

Striping (条 纹 划 分 )，309 

Strong passwords (高 强度 密码 )，367 

Stylus tracking (手写 笔 跟 踪 )，73 

Subfiles(CP/M 系统 中 的 批 处 理 文件 类 型 的 名 称 )， 
59 

Subroutines ( 子 程序 ， 或 称 为 子 例 程 )，61 

Subsystems ( 子 系统 )，422 

Suites (套件 )，341 

Summary Information (摘要 信息 )，436 

Sun Microsystems (太阳 微 系统 公司 )，110，291， 
393 ，454 

SuperFetch (超级 预 提 取 机 制 )，420 

Supervisor mode (管理 程序 模式 ， 或 称 为 管 态 )， 
29，490 

Support models，threads (支持 模型 ， 线 程 )，171f 

Suspended state (暂停 状态 )，155 

Swap file (对 换文 件 )，243 

Swap instruction (一 条 基于 对 调 变量 取 值 原子 操 
作 的 硬件 锁 指 令 )，193 

Swap out (对 换 到 外 存 )，23 

Swapping (对 换 技 术 )，215-216，216f 

Sweep workflows (横扫 型 工作 流 )，133 

Switch (交换 机 )，347 

Switcher (切换 器 程序 )，97 

“Switcher”memory layout(“ 切 换 器 ”内 存 布 局 )， 


97f 

Switches/switching (交换 机 /交换 )，334，336， 
346-347 

Switching devices (交换 设备 )，505 

Syllable( 一 个 关于 面向 对 象 操作 系统 的 研究 项 目 )， 
38 

Symbian ( 塞 班 公司 ; 塞 班 操作 系统 )，68，251， 
252f, 452, 476 

Symbolic Optimizing Assembler Program ( SOAP， 
符号 优化 式 汇编 程序 )，211 

Symbolic references (符号 引用 ， 或 称 为 符号 式 引 
用 )，262 

Symbol table (符号 表 )，119 

Symmetric algorithm ( 对称 算 法 )，375 

Symmetric key encryption (对 称 密 钥 加 密 )，375， 
375f 

Symmetric multiprocessing ( SMP， 对 称 多 处 理 )， 
125 125f,1132-134, 133§ 

Sync application (一 款 用 于 实现 手持 式 装置 上 的 
数据 库 文件 与 个 人 计算 机 上 的 数据 库 文件 之 
间 的 同步 的 应 用 程序 )，74 

Synchronization (同步 )，190-197，400-406 

Synchronous attributes (同步 通信 属性 )，185，187- 
188 

Synchronous IO (同步 输入 /输出 )，187-188 

SYN Flood ( 洪 泛 攻击 )，363 

Sysadmin (系统 管理 员 )，121 

Sysgen ( system generation， 一 条 用 于 生成 系统 的 
命令 )，437 

System 1 (第 1 版 Mac 操作 系统 )，94f 

System 2 (第 2 版 Mac 操作 系统 )，96-97，97f 

System 3 (第 3 版 Mac 操作 系统 )，98 

System 4 (第 4 版 Mac 操作 系统 )，98-100，99f 

System 5 (第 5 版 Mac 操作 系统 )，98，100 

System 6 (第 6 版 Mac 操作 系统 )，101 

System 7 (第 7 版 Mac 操作 系统 )，101-105 

System 8 (第 8 版 Mac 操作 系统 )，106-107 

System 9 (第 9 版 Mac 操作 系统 )，107-109 

System administrator (系统 管理 员 )，7f，8，121 

System bus (系统 总 线 )，491 

System calls (系统 调用 )，7，36，495 

System clock (系统 时 钟 )，493 

System heap (系统 堆 )，95-96 

System idle task (系统 空闲 任务 )，175 
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System managers (系统 管理 员 )，7t 

System partition (系统 分 区 )，94 

System programmers (系统 程序 员 )，7，7f 

System program (系统 程序 )，21 

System timing (系统 时 序 )，493 

System view (系统 视图 )，6，8-10，9f，10f 

Systemwide open file table (系统 范围 的 打开 文件 
表 ， 简 称 系统 打开 文件 表 )，122 

System X (第 10 版 Mac 操作 系统 ， 即 和 版 Mac 
操作 系统 )，107 

T 

Tables ( 表 )，37 

Tagged queuing (标记 式 排队 )，321-322 

TAJ (一 个 关于 面向 对 象 操作 系统 的 研究 项 目 )， 
38 

Tanenbaum，Andrew (安德鲁 ， 塔 嫩 鲍 姆 )，115 

Tape drives (磁带 驱动 器 )，325 

Tapes (磁带 )，499 

Task automation (任务 自动 化 )，102 

Tasklet (小 任务 )，120 

Tasks (任务 )，26，151，176 

TCP communication (支持 传输 控制 协议 的 通信 )， 
474 

TCP header format (传输 控制 协议 报头 格式 )，339f 

TCP/IP (传输 控制 协议 / 网 际 协议 )，341-345，404， 
440 

TCP/IP protocol suite( 传输 控制 协议 / 网 际 协议 簇 )， 
334 

TCP Wrapper ( tcpd， 传 输 控 制 协议 包装 器 ， 或 称 
为 传输 控制 协议 包装 程序 )，463 

TDM circuits (时 分 多 路 复 用 电路 )，350-351 

Telecommunications Industry Association ( TIA ， 
美国 通信 工业 协会 )，352 

Telecommuting (远程 办 公 )，333 

Telephony applications (电话 应 用 程序 )，475，475t 

Teletype( 电 传 打字 机 )，49 

Telnet (一 款 用 于 登录 到 远程 机 器 的 服务 例 程 ; 远 
程 终端 协议 )，338，344，379，461 

Temporal locality (时 间 局 部 性 )，500 

Terminated state (终止 状态 )，27 

Tertiary storage (第 三 级 存储 器 )，499 

Test and Set instruction (一 种 基于 测试 -设置 原 
子 操作 的 硬件 锁 指令 )，192-193 

THE OS (THE 操作 系统 )，204 
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Thin client ( 瘦 客 户 端 )，388 

Third-party service (第 三 方 服务 )，183，386 

32-bit clean (彻底 32 位 的 ， 或 称 为 纯粹 32 位 的 )， 
101 

Thompson，Ken ( 肯 ' 汤 普 逊 )，114 

Thrashing (抖动 ， 或 称 为 颠 艇 )，245-246 

Thread control block (TCB ， 线 程控 制 块 )，166 

“Thread of execution” (执行 的 线程 )，166 

Thread pool (线程 池 )，171 

Thread priority relationships (线程 优先 级 关系 )，424f 

Threads (线程 )，167f，168f，170-177，170f，171f， 
174f，391-392 

Thread-safe (线程 安全 的 )，172 

3Com (3Com 公司 )，441 

370TFLOPS (每 秒 370 万 亿 次 浮 点 运算 操作 )，144 

Three-layer model (三 层 模型 )，388-389，389f 

Three-state model (三 状态 模型 )，154 

Throughput (吞吐 量 )，132，160 

Ticket granting agencies (票据 授予 机 构 )，135 

Time division multiplexing (TDM， 时 分 多 路 复 用 )， 
350 

Time quantum (定量 时 间或 时 间 额 度 ， 即 时 间 片 )， 
23 

Timer interrupt( 定 时 器 中 断 )，492 

Time sharing (分 时 共享 ， 或 简称 分 时 )，218 

Time-sharing OS (分 时 操作 系统 )，31 

Time slice (时 间 片 )，447 

Timestamp【〈 时 间 惟 )，400 

TLB ( 快 表 ， 又 称 为 转换 后 援 缓冲 器 )，391 

TLB miss ( 快 表 的 未 命中 率 )，229 

Token passing bus ( 令 牌 传送 式 总 线 )，337 

Token Ring ( 令 牌 环 网 ; 令 牌 环 算法 )，300，308， 
346, 348, 402, 404f, 457 

Top-half organization (上 半 部 组 织 结 构 )，120 

Top level domain (TLD， 顶 级 域名 )，343 

Topologies (拓扑 结构 )，335-338，336-338f 

TopView (IBM 公司 研发 的 一 种 多 处 理 8x86 环境 )， 
417 

TORQUE (万 亿 级 开源 资源 与 队列 管理 器 )，145 

Torvalds，Linus〈 李 纳 斯 ， 托 瓦 获 )，114，117 

Traceroute (一 款 用 来 发 现 连 接 两 台 网 络 主机 之 
间 的 一 系列 路 由 器 的 实用 例 程 ， 即 Tracert)， 
354 

Tracert (一 款 用 来 发 现 连接 两 台 网 络 主机 之 间 的 


一 系列 路 由 器 的 实用 例 程 )，354 

Track buffer (磁道 缓冲 )，323 

Tracking cookies (跟踪 式 小 型 文本 文件 )，366 

Tracks (磁道 )，54，302，302-303 

Traffic monitor (通信 监视 器 )，379 

Transaction (事务 )，405 ，432 

Transaction abort (事务 夭折， 或 称 为 事务 中 止 )， 
406 

Transactional file system (事务 型 文件 系统 )，295 

Transaction commit (事务 提交 )，406 

Transaction processing (事务 处 理 )，31，295 

Transaction start (启动 事务 )，406 

Transaction support (事务 支持 )，432，434 

Transfer (传输 )，304-305，305t 

Transient (瞬时 的 )，185，188 

Transitions (状态 转换 )，154-156，154f 

Translate (转换 成 )，210 

Translation lookaside buffer (TLB ， 快 表 ， 又 称 为 
转换 后 援 缓冲 器 )，172，228，228f 

Transmission control protocol ( TCP， 传输 控制 协 
议 )，341 

Transparency，lack of (透明 性 ,缺乏 )，387 

Transparent bridge (透明 网 桥 )，347 

Transport layer (传输 层 )，334，341-342 

Transport layer security (TLS ， 传 输 层 安全 协议 )， 
378 

Traps〈 异 常 ， 或 称 为 陷 人 事件 )，495 

Trash (垃圾 箱 ， 或 称 为 回收 站 )，96 

Tree directory structure( 树 形 目录 结构 )，260f 

Tree structure( 树 形 结构 )，260-261，260f 

Trojans (特洛伊 木马 ， 或 简称 木马 )，361 

True identifiers (真正 的 标识 符 )，394 

TrueType (一 种 字体 管理 程序 及 字 型 标准 )，102 

Trusted third party (TTP， 可 信 的 第 三 方 )，375 

Tunneling (网 络 隧 道 )，396 

Twisted pair ( 双 绞 线 )，352 

Two disk drives (两 个 磁盘 驱动 器 ， 或 简称 双 磁 
盘 )，306f 

Two-factor authentication( 双 因素 身份 认证 ,或 称 
为 双重 身份 认证 )，367 

Two-level page table (两 级 页 表 )，231，231f 

Two-phase commit (两 阶段 提交 )，406 

U 
UClinux (一 种 苞 和 人 式 Linux 操作 系统 )，446 


UDF (基于 统一 光盘 格式 的 文件 系统 类 型 )，428 

UltraSPARC" (超级 可 伸缩 处 理 器 体系 结构 )，233 

Unconditional jump operation (无 条 件 跳 转 操作 )， 
489f 

Unicast ( 单 点 传送 )，184，186 

Unicode Consortium (统一 码 联盟 ， 或 称 为 统一 码 
协会 )，106，107，435 

Unicode support (统一 字符 编码 标准 支持 )，106- 
107 

Unics ( UNIX 操作 系统 名 称 的 男 一 种 写法 ) . 见 
UNIX 

Uniform resource locator (URL， 统 一 资源 定位 符 )， 
339 

University of California San Diego (加 利 福 尼 亚 大 
学 圣地 亚 哥 分 校 )，39 

University of Helsinki (赫尔辛基 大 学 )，114 

University of Wisconsin (威斯康星 大 学 )，136，137 

UNIX (UNIX 操作 系统 )，286-287，460t 

Unmarshalling ( 解 组 )，396 

Unqualified name ( 非 限定 文件 名 )，263 

Unreliable datagram (不 可 靠 的 数据 报 )，341 

Unshielded twisted pair (UTP， 非 屏蔽 型 双 绞 线 )， 
352 

USB ( Universal Serial Bus， 通 用 串 行 总 线 )，106， 
119, 438, 446 

Use bit (使 用 位 )，242 ; 

User account control (UAC， 用 户 账户 控制 )，419 

User applications (用 户 应 用 程序 )，74-75 

User datagram protocol (UDP， 用 户 数据 报 协议 )， 
340-341，404，474 

User interface (UI， 用 户 界 面 )，24，388，478 

User interface IO devices (用 户 接口 型 输入 /输出 
设备 )，502 

User-level thread (用 户 级 线程 )，169-170 

User mode.( 用 户 模式 ， 也 称 为 目 态 )，29，490 

User-mode driver framework (UMDEF， 用 户 模式 
驱动 程序 框架 )，419 

User number (用 户 编号 )，56 

User optimization vs. hardware optimization (用 户 
最 优化 与 硬件 最 优化 )，41 

User OS environment (用 户 操作 系统 环境 )，421- 
423 

User release (“用 户 ” 版 本 )，116 

Users of OS (操作 系统 的 用 户 )，6-8，7t 
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User view (用 户 视图 )，6，8 

User-visible registers (用 户 可 见 寄存 器 )，493 

Utilities (实用 例 程 )，11 

Utility programs (实用 程序 ， 或 称 为 实用 例 程 )， 
344 

Utilization (利用 率 )，132 

V 

Valid bits (有 效 位 )，230，242f 

Variable number of processes (可 变数 量 的 进程 )， 
218-221, 219f 

VAX system (VAX 计算 机 系统 )，184，362，440 

VBScript (一 种 脚本 语言 )，365 

VCalendar (日 程 安排 交换 格式 标准 )，474 

VCard (电子 名 片 交 换 格式 标准 )，474 

Vector (向 量 )，400 

V850 (NEC 公司 的 v850 处 理 器 )，446 

Venter, J Craig (J. 克 雷 格 ， 文 特 尔 )，143 

Vertical distribution (垂直 分 布 )，389-390 

Vi command (一 种 文本 编辑 实用 程序 及 命令 )，264 

Video (视频 )，109 

Video attributes (视频 属性 )，53 

Video monitor output (视频 监视 顺和 输出 )，53-54 

Vines (虚拟 集成 网 络 服务 协议 )，345 

Virtual file system ( VFS， 虚 拟 文件 系统 )，291， 
291f, 292f, 452-454, 453f 

Virtualizing (虚拟 化 )，38 

Virtual machines (VM， 虚 拟 机 )，38-40，39f，392- 
394，392f，393f 

Virtual memory (VM， 虚 拟 内 存 ， 或 称 为 虚拟 存 
储 器 )，101-103 ，243，425 

Virtual organizations (虚拟 组 织 )，140 

Virtual page table (虚拟 页 表 )，232 

Viruses (病毒 )，345 

Virus scanners (病毒 扫描 器 )，361 

VisiCorp (VisiCorp 公司 )，417 

VisiOn (个 人 软件 公司 开发 和 发 布 的 一 款 图 形 化 
界面 支撑 环境 )，417 

Vista (Windows Vista 操作 系统 )，432 

Visual Basic (一 种 编程 语言 ， 即 VB)，476 

Volatile memory ( 易 失 性 存储 器 )，498 

Volume information ( 卷 信息 )，430 

Volume layout ( 卷 布局 )，429f 

Volume mount points ( 卷 挂 载 点 )，433 

Volume name ( 卷 名 )，430 
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Volume shadow copy ( 卷 影 复制 )，432，434 
Volume version ( 卷 版 本 )，430 
Volunteer computing (志愿 计算 )， 
clusters (志愿 计算 集群 )，144 
systems (志愿 计算 系统 )，130 
W 
Waiting (等 待 状态 )，26 
Waiting semaphores (信号 量 申请 操作 )，193 
Wait routine (wait 例 程 )，193 ，194 
Wait state (等 待 状态 )，27，155 
Wall time (挂钟 时 间 )，131 
Warm standby( 暖 备份 )，314 
Wavelength division multiplexing ( WDM， 波 分 复 
用 )，353 
Web interfaces (万 维 网 界面 ， 或 称 为 网 站 界面 )， 
146-147 
Webserv (一 个 系统 名 称 示 例 )，394 
Web servers ( 万维网 服务 器 ， 或 称 为 网 站 服务 器 )， 
31，484 
Well-known port number (标准 端口 的 端口 号 )，339 
Well-known sockets (大 家 都 很 熟悉 的 套 接 字 )，189 
Wide area networks (WANs， 广 域 网 )，335，350- 
351, 506 
Wi-Fi (无 线 保 真 标准 )，353，473 
Window manager (窗口 管理 器 )，459 
Windows (Windows 操作 系统 )，4 
API (Windows 应 用 程序 编程 接口 )，422 
ME ( Millennium Edition， 千 禧 版 Windows 操 
作 系 统 )，417 
Mobile (Windows 手机 版 操作 系统 )，68 
95 (Windows 95 操作 系统 )，417 
98 SE ( second edition， 第 二 版 的 Windows 98 
操作 系统 )，417 
NT 5.0 (Windows NT 5.0 版 内 核 )，418 
Server 2003 ( Windows 2003 服务 器 版 操作 系 
统 )，418 
6.0 (Windows 6.0 版 内 核 )，418 
3.x (Windows 3.x 操作 系统 )，109，421-422 
3.0 (Windows 3.0 操作 系统 )，417 
2000 (Windows 2000 操作 系统 )，33，373，418 
Win32( Windows 操作 系统 Win32 库 例 程 )， 
250 
XP ( Windows XP 操作 系统 )，250-251，395， 
418, 422 
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XP x64 Edition ( 64 位 Windows XP 操作 系统 )， 
418 
Windows NT (Windows NT 操作 系统 )，415-442 
family architecture of (Windows NT 系列 操作 系 
统 体系 结构 )，422f 
family history of (Windows NT 系列 操作 系统 发 
展 例 程 )，416-421 
Windows on Windows Virtual DOS Machine ( WOW 
VDM， 在 Windows 操作 系统 的 虚拟 DOS 计 
算 机 上 的 窗口 )，423 
WINS server ( Windows 网 络 命名 服务 的 服务 器 )， 
461 
Win32 (Win32 接口 )，417 
Wireless access protocol ( WAP， 无 线 访问 协议 )， 
479 
Wireless LANs (无 线 局 域 网 )，308 
Wireless markup language(WML ， 无 线 标记 语言 )， 
479 
Wireless networking (无 线 网 络 )，353 
Wire speed ( 线 速 )，338，347 
Wiring concentrator 接线 集中 器 ， 又 称 为 集线器 )， 
346 
WordPerfect (一 种 文字 处 理 程 序 )，92 
Words ( 字 ， 一 种 存储 单位 )，496 
Worker thread (工作 线程 )，392 
Workflows (工作 流 )，130-132，130f，131f，137 
Working set (工作 集 )，240-242，241t，242f，243f 
Work time (工作 时 间 )，131 
WorldScript (一 种 为 除了 英语 之 外 的 语言 提供 系 
统 级 支持 的 程序 ， 寅 意 世 界 文字 )，102 
World Wide Web (WWW， 万 维 网 )，68，110， 
398，474 
Worms (蠕虫 )，362 
Worst fit (最 坏 适 应 算法 )，219 
Wrap-up phase (程序 的 总 结 报告 阶段 )，215 
Write-back ( 写 回 结果 )，494 
X 
XADD instruction (英特尔 处 理 器 的 一 条 指令 
XADD), 193 
Xerox Palo Alto Research Center ( PARC， 施 乐 帕 
洛 阿尔 托 研究 中 心 )，90，362，417 
Xerox Star (施乐 之 星 ， 一 款 早期 的 计算 机 系统 )， 
90 
X.500 (X.500 目录 服务 网 络 标准 )，395 
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XFS (一 种 文件 系统 )，295 Y 
XNS (施乐 网 络 系 统 协 议 )，184 Y2K bug (千年 虫 问 题 )，41，101 
XPBS ( Globus 集群 中 间 件 调度 程序 的 一 种 图 形 4 
化 用 户 界 面 版 本 )，146 Zilog Z-80 (美国 齐 格 洛 公司 设计 的 Z80 处 理 器 )， 
X-Terminal (X 终端 )，388 50 
X-Windows (一 种 图 形 化 用 户 界面 )，417 Zombies (僵尸 )，363 


X-Window (X11) system ( X-Window 系统 协议 ， 即 ”Zone bit recording (ZBR， 区 位 记录 )，303 
X11 系统 协议 )，458-459 , Z/VM (一 款 硬件 级 虚拟 机 ， 即 仿真 软件 包 )，38 


